Meta 下週或發表兩個小型 Llama 3 模型

作者 | 發布日期 2024 年 04 月 10 日 7:50 | 分類 AI 人工智慧 , Facebook , 軟體、系統 line share follow us in feedly line share
Meta 下週或發表兩個小型 Llama 3 模型


The Information 8 日報導,Meta 計劃下週推出兩款小型 Llama 3 模型,為即將夏季發表的正式版 Llama 3 模型鋪路。

Meta 相信,兩款小模型有助激發人們對 Llama 3 模型的興趣。Meta 希望 Llama 3 能追上 OpenAI GPT-4,後者能根據用戶上傳到聊天機器人的圖片回答問題。正式版 Llama 3 支援多模組,理解並產生文字和圖像。但兩款小模型不具多模組功能。

與大型模型相比,小模型通常成本更低,執行速度更快,大型模型成本高昂,小模型價值日益突顯。對想用行動裝置開發人工智慧軟體的開發者來說,小模型也很有價值。

Meta 先前發表三種 Llama 2 模型,最大有 700 億個參數,設定編碼模型訓練過程的學習內容。另兩個模型分別有 130 億個參數和 70 億個參數。最近幾個月,Meta 高層認為 Llama 2 回答有爭議問題時過於保守,因此生成式 AI 部門員工一直努力讓 Llama 3 更開放回答有爭議的問題。

Meta 7 月後或發表正式版 Llama 3 大模型,可能有超過 1,400 億個參數。

(本文由 品玩 授權轉載;首圖來源:AI at Meta