
鴻海上午宣布,鴻海研究院推出第一版有推理能力的人工智慧(AI)繁體中文大型語言模型,未來會導入 AI 大型語言模型,強化智慧製造、智慧電動車、智慧城市三大平台的數據分析效率。
模型訓練過程,鴻海說明,輝達提供Taipei-1超級電腦及技術諮詢,讓鴻海研究院使用輝達NeMo人工智慧模型服務,順利完成模型訓練。
鴻海新聞稿宣布,鴻海研究院推出首款繁體中文AI大型語言模型(LLM),開發代碼FoxBrain,原為公司應用設計,涵蓋數據分析、決策輔助、文書協作、數學、推理解題與代碼生成等功能,後續將對外開源分享。
「開源」(open sourced)意指支撐AI的運算代碼公開給其他企業和研究人員,讓所有人都能用這些技術建構推廣產品。
鴻海指出,FoxBrain為鴻海研究院AI推理LLM模型訓練成果,展現理解與推理能力,數學與邏輯推理測試表現出色,還能強化台灣使用者的語言風格。
鴻海研究院說明,人工智慧研究所FoxBrain訓練過程用120張輝達(NVIDIA)H100繪圖處理器(GPU),並經NVIDIA Quantum-2 InfiniBand網路擴展,僅花約四週完成,模型訓練方式低成本且更具效率。
相關規格與訓練策略,鴻海研究院指出,FoxBrain透過自主技術,建立24類主題的資料增強方式與品質評估方法,產生98B詞元(tokens)高品質中文預訓練資料,上下文處理長度128K token,總計算力花費2688 GPU days,採多節點平行訓練架構,確保高效能與穩定性。
測試結果,鴻海研究院表示,FoxBrain在數學領域較基礎模型Meta Llama 3.1全面提升,相較目前最佳繁體中文大模型Taiwan Llama,數學測試取得顯著進步,數學推理能力超越Meta同等級模型,與DeepSeek蒸餾模型仍有些微差距,但表現相當接近世界領先水準。
鴻海指出,未來會導入AI大型語言模型,強化智慧製造、智慧電動車、智慧城市三大平台數據分析效率,讓FoxBrain成為驅動智慧應用升級的重要引擎,之後會開源分享,擴大模型運用範圍,與技術夥伴共同推動AI製造業、供應鏈管理與智慧決策領域應用。
鴻海表示,FoxBrain成果將於美國時間3月17日登場的輝達年度GTC大會專題演講,以「From Open Source to Frontier AI: Build, Customize, and Extend Foundation Models」為主題,首次發表。
(作者:鍾榮峰;首圖來源:鴻海)