Llama 3 為基礎,國科會釋出 80 億參數 TAIDE 新模型

作者 | 發布日期 2024 年 04 月 29 日 16:29 | 分類 AI 人工智慧 , 科技政策 line share follow us in feedly line share
Llama 3 為基礎,國科會釋出 80 億參數 TAIDE 新模型


隨著 Meta 新推出 Llama 3 8B 模型,國科會 29 日進一步釋出 Llama 3-TAIDE-LX-8B-Chat-Alpha1 模型,是完成基本測試、具台灣文化的大型繁體中文模型。

Meta 19 日公開新一代大型語言模型 Llama 3,在各項評比表現超越前一代 Llama 2。為了盡快提升以 Llama 3 為基礎、具台灣文化的繁體中文模型,TAIDE(Trustworthy AI Dialogue Engine,可信賴 AI 對話引擎)團隊第一時間以過去一年開發 TAIDE 模型所掌握的經驗,加上累積整理的繁體中文資料集,以僅僅 4 天時間投入訓練,經過基本測試,釋出 Llama 3-TAIDE-LX-8B-Chat-Alpha1 模型。

研究人員和開發者可藉由 TAIDE 官網「TAIDE 模型」連結,再進入該頁面提供的 Hugging Face 連結下載,就能開始使用並體驗這款具台灣文化的大型語言模型。

國科會自 15 日釋出以 Llama 2 為基礎的繁體中文可商用模型 TAIDE-LX-7B,目前在開放社群平台上,許多高手提供不少安裝和使用指南,也有 10 餘家廠商及多個學研團隊和公部門開始導入 TAIDE 模型開發相關應用。

對於 TAIDE 團隊僅用 4 天完成模型訓練,並能馬上開放商用版本供產學研界使用,國科會主委吳政忠表示高度肯定。TAIDE 團隊後續也將收集各界意見回饋並滾動調整,持續精進 TAIDE 系列模型。

(首圖來源:freepik

延伸閱讀: