Meta 下週或發表兩個小型 Llama 3 模型

The Information 8 日報導，Meta 計劃下週推出兩款小型 Llama 3 模型，為即將夏季發表的正式版 Llama 3 模型鋪路。

Meta 相信，兩款小模型有助激發人們對 Llama 3 模型的興趣。Meta 希望 Llama 3 能追上 OpenAI GPT-4，後者能根據用戶上傳到聊天機器人的圖片回答問題。正式版 Llama 3 支援多模組，理解並產生文字和圖像。但兩款小模型不具多模組功能。

與大型模型相比，小模型通常成本更低，執行速度更快，大型模型成本高昂，小模型價值日益突顯。對想用行動裝置開發人工智慧軟體的開發者來說，小模型也很有價值。

Meta 先前發表三種 Llama 2 模型，最大有 700 億個參數，設定編碼模型訓練過程的學習內容。另兩個模型分別有 130 億個參數和 70 億個參數。最近幾個月，Meta 高層認為 Llama 2 回答有爭議問題時過於保守，因此生成式 AI 部門員工一直努力讓 Llama 3 更開放回答有爭議的問題。

Meta 7 月後或發表正式版 Llama 3 大模型，可能有超過 1,400 億個參數。

（本文由品玩授權轉載；首圖來源：AI at Meta）