優必達Lilith獲Meta推薦 5個你不知道的研發關鍵
生成式AI浪潮持續發酵,企業紛紛探索如何運用這項技術來提升營運效率和優化服務品質。對台灣企業而言,無論選擇何種應用方案,採用繁體中文大語言模型都能讓AI回應更貼近在地需求,創造更高的應用價值。
而在現有的繁中大語言模型裡,優必達Lilith-3.3-70B是表現最突出的一個,不只在繁體中文驗證集「TMMLU+」取得76.06%的準確率,領先其他繁中模型,更創下台灣第一個獲得Meta官方認可、並在Llama官網推薦的繁中大型語言模型之紀錄。
Lilith-3.3-70B是以Meta的Llama 3.3 70B為基礎,針對繁體中文進行了大規模的專業語料微調(Fine-Tuning)訓練,並結合連鎖式推理(Chain-of-Thought;CoT)、混合專家模型(Mixture of Experts; MoE)等先進技術,大幅提升AI模型在繁體中文的語言理解、邏輯推理以及專業領域應用的表現。
5大關鍵要素 打造Lilith-3.3-70B絕佳表現
若進一步探究優必達研發Lilith-3.3-70B的歷程,可發現其優異表現可歸功於以下5大因素。第一是累積豐富的研發經驗。優必達執行長郭榮昌表示,自Meta於2023年發布Llama 2以來,優必達便積極與學界合作發展繁中大型語言模型,歷經兩年多的深耕,研發團隊已深諳AI模型訓練的關鍵要素與技術重點。
第二是使用來自學界業界的高品質繁體中文文本作為訓練數據集。為了確保AI模型具備高水準的語言表達能力,優必達除了與台大合作,亦與金融、醫療、科技、媒體等產業進行資源交換,將學界與產業提供的學術論文、新聞、小說、科技資料等高品質文本,作為Lilith-3.3-70B的訓練數據集,確保模型能夠更精準地理解繁體中文語境與專有名詞。
第三為透過實戰數據持續精進模型能力。郭榮昌指出,Lilith-3.3-70B上線後,優必達持續蒐集用戶的回饋意見以及自家AI VTuber Ubi-chan的直播互動數據,據此進行模型調校,不斷優化其在專業名詞/在地用語理解、即時對話與個性化互動等方面的能力。
第四為採用CoT、MoE等最新技術。除了提升Lilith-3.3-70B的語言理解能力外,優必達也使用CoT、MoE等技術,強化Lilith-3.3-70B的邏輯推理以及專業領域應用的能力。尤其透過CoT訓練可以讓Lilith-3.3-70B學會分步解題,在數學推導、法規解析、技術問題回答等需要嚴謹邏輯推理的任務中,有更好的表現,甚至優於一般大型語言模型。
第五擁有充足的GPU算力為後盾,可以進行高頻次模型訓練與微調,以確保Lilith-3.3-70B能夠達到最佳表現。
以Lilith-3.3-70B為核心 持續推動產業導入生成式AI應用
在深耕繁中大語言模型研發之餘,優必達亦積極推動Lilith-3.3-70B的產業應用,郭榮昌表示,「我們希望透過Lilith-3.3-70B可以加速企業導入生成式AI應用,提升台灣產業整體競爭力」。
郭榮昌進一步解釋,包括金融、壽險、醫療等受到主管機關高度監管的產業,或是製造等相當重視商業機密的產業,其實都有強烈的生成式AI應用需求,但這些產業基於法規和資安考量,而無法使用公有雲的AI服務,而優必達Lilith-3.3-70B可以架構在地端,協助企業以私有雲的架構導入生成式AI應用,相信可以加快企業導入生成式AI應用的腳步。
此外,優必達也看好未來的產業升級需求,將Lilith-3.3-70B結合機器人應用,發展更多加值服務。以餐飲業為例,機器人不再侷限於單純的送餐功能,還能與顧客互動推薦餐點、協助點餐等,而應用在零售業,則可協助顧客快速找到目標商品,並即時提供完整的產品資訊,大幅提升購物體驗與效率。
「機器人應用已是必然趨勢,也是優必達未來發展重點,我們將加大在多模態模型上的研發力道,讓機器人能夠更好地與人類互動。」郭榮昌最後強調。