
2023 年 4 月啟動的「可信賴 AI 對話引擎」(Trustworthy AI Dialog Engine,TAIDE)計畫,打造以繁體中文為核心的開源 AI 模型,力求融入台灣在地語言、價值觀、文化特色等元素,期望進一步發展台灣的主權 AI。
繼今年 2 月釋出 Llama 3.1-TAIDE-LX-8B-Chat 版本,TAIDE 團隊開發的最新版 Gemma-3-TAIDE-12B-Chat 近日上傳至開源機器學習社群平台 Hugging Face。
Gemma 3 TAIDE 系列模型的說明指出,它以 Google 開發的 Gemma 3 12B 模型為基礎,導入台灣不同領域可用的文字資料和訓練素材,提升模型在繁體中文回應的能力和特定任務的表現。
目前公開釋出的 Gemma-3-TAIDE-12B-Chat,就以 Gemma-3-12b-pt 版本為基礎,使用繁體中文資料持續預訓練(continual pretraining),並透過指令微調(instruction tuning),強化如摘要、寫信、寫文章、中翻英、英翻中等辦公室常用任務,並具備多輪問答對話能力。TAIDE 團隊嚴格把關模型的訓練資料,提升生成內容的可信任性和適用性。
(首圖來源:Hugging Face)