台智雲發表 FFM-Llama3 系列模型,繁中表現超越 GPT-4

作者 | 發布日期 2024 年 05 月 02 日 16:30 | 分類 AI 人工智慧 , 雲端 line share follow us in feedly line share
台智雲發表 FFM-Llama3 系列模型,繁中表現超越 GPT-4


繼「繁體中文強化版 FFM-Llama 2 大語言模型」,華碩旗下台智雲新推出 FFM-Llama3-70B、FFM-Llama3-8B 大語言模型及 AFS ModelSpace 模型 API 服務。

經 TMMLU+ 實測,FFM-Llama3-70B 在繁體中文大型語言模型(Large Language Models,LLM)表現首次超越 GPT-4,福爾摩沙大語言模型(Formosa Foundation Model,FFM)中的 FFM-Mixtral-8×7B、FFM-Mistral-7B、FFM-Llama2-v2、FFM-Llama3-8B,整體評分也超越 GPT-3.5,確立台智雲在繁中 LLM 的領先地位。

▲ FFM-Llama3 的 TMMLU+ 測試表現。(Source:台智雲)

透過新增支援函式呼叫功能,新模型可快速串接外部應用,比方說 Google 地圖、搜尋引擎、交通訂票、即時股價查詢等,幫助開發者強化模型能力,加速開發商業應用,也成為唯一擁有這項功能的繁中 LLM。

AFS ModelSpace 則提供企業多種開源 LLM、自動化工具及管理服務。最新釋出如 FFM-Llama3、FFM-Mistral、Code Llama、TAIDE 等開源模型,讓開發者簡化管理程序,可直接推論使用和快速切換模型。新增的「Public Mode」API 計費模式,以 token 用量計費,大幅減少中低用量企業的成本和時間。

▲ FFM 家族模型。(Source:台智雲)

「台智雲聚焦提供企業所需的生成式 AI,包含 AIHPC 高速運算力、可信賴的繁體中文大型語言模型、No-code 平台。」台智雲技術長陳忠誠在今日線上技術論壇表示,從雲端到地端,台智雲有效協助解決企業在成本、時間、人力、資安等考量,且會持續支援優秀的開源模型,為企業客戶提供最完整的解決方案。

(首圖來源:pixabay

延伸閱讀: