輝達助攻,鴻海研究院推首版繁體中文 AI 大語言模型

作者 | 發布日期 2025 年 03 月 10 日 11:10 | 分類 AI 人工智慧 , 軟體、系統 , 開放資料 line share Linkedin share follow us in feedly line share
Loading...
輝達助攻,鴻海研究院推首版繁體中文 AI 大語言模型

鴻海上午宣布,鴻海研究院推出第一版有推理能力的人工智慧(AI)繁體中文大型語言模型,未來會導入 AI 大型語言模型,強化智慧製造、智慧電動車、智慧城市三大平台的數據分析效率。

模型訓練過程,鴻海說明,輝達提供Taipei-1超級電腦及技術諮詢,讓鴻海研究院使用輝達NeMo人工智慧模型服務,順利完成模型訓練。

鴻海新聞稿宣布,鴻海研究院推出首款繁體中文AI大型語言模型(LLM),開發代碼FoxBrain,原為公司應用設計,涵蓋數據分析、決策輔助、文書協作、數學、推理解題與代碼生成等功能,後續將對外開源分享。

「開源」(open sourced)意指支撐AI的運算代碼公開給其他企業和研究人員,讓所有人都能用這些技術建構推廣產品。

鴻海指出,FoxBrain為鴻海研究院AI推理LLM模型訓練成果,展現理解與推理能力,數學與邏輯推理測試表現出色,還能強化台灣使用者的語言風格。

鴻海研究院說明,人工智慧研究所FoxBrain訓練過程用120張輝達(NVIDIA)H100繪圖處理器(GPU),並經NVIDIA Quantum-2 InfiniBand網路擴展,僅花約四週完成,模型訓練方式低成本且更具效率。

相關規格與訓練策略,鴻海研究院指出,FoxBrain透過自主技術,建立24類主題的資料增強方式與品質評估方法,產生98B詞元(tokens)高品質中文預訓練資料,上下文處理長度128K token,總計算力花費2688 GPU days,採多節點平行訓練架構,確保高效能與穩定性。

測試結果,鴻海研究院表示,FoxBrain在數學領域較基礎模型Meta Llama 3.1全面提升,相較目前最佳繁體中文大模型Taiwan Llama,數學測試取得顯著進步,數學推理能力超越Meta同等級模型,與DeepSeek蒸餾模型仍有些微差距,但表現相當接近世界領先水準。

鴻海指出,未來會導入AI大型語言模型,強化智慧製造、智慧電動車、智慧城市三大平台數據分析效率,讓FoxBrain成為驅動智慧應用升級的重要引擎,之後會開源分享,擴大模型運用範圍,與技術夥伴共同推動AI製造業、供應鏈管理與智慧決策領域應用。

鴻海表示,FoxBrain成果將於美國時間3月17日登場的輝達年度GTC大會專題演講,以「From Open Source to Frontier AI: Build, Customize, and Extend Foundation Models」為主題,首次發表。

(作者:鍾榮峰;首圖來源:鴻海

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》