Meta 最近宣布,由於性能問題,延後推出最新大型語言模型「Avocado」。《紐約時報》報導,此為基準測試顯示 Avocado 推理準確性、幻覺率和多模態處理效率等關鍵領域表現不佳後決定。
Meta於Menlo Park實驗室壓力測試時,Avocado複雜數學和寫程式錯誤率比OpenAI GPT-5和Anthropic Claude 3.5高15%~20%。
Meta 1月Connect大會說Avocado是「下世代尖端模型」,並承諾消費者硬體會有更高效率,並能無縫整合至Meta生態系統如Instagram、WhatsApp和Ray-Ban智慧眼鏡。原定3月中旬開放合作夥伴首次測試,並以Llama 4(Avocado開源版)開放給大眾。
Avocado開發部門為Meta AI的Fair,基於Llama 3.1架構,採稀疏專家混合(MoE),參數達2兆,訓練資料庫為自定義的10兆標記,重點強調來自Meta平台即時社群媒體數據。2月外洩基準顯示Avocado於MMLU(89.2%對88.7%)和HumanEval(92% pass@1)略勝GPT-4o,外界開始猜測2026年上半AI主導者會是誰。
然內部備忘錄指出,微調時Meta資料中心過熱,且安全防護措施不一,使公司安全審核多花了兩週時間。Meta 12日晚間確認發表延期:「我們致力提供最高品質的AI體驗。經過嚴格評估,我們決定延長模型測試期,以確保符合標準。更多細節很快會公布。」雖然未說新時間表,但相關人士表示,最早可能第二季推出。
分析師表示擔憂,Wedbush Securities的Dan Ives稱這是大型科技公司AI競賽的「警鐘」,並指出Meta的2025年AI資本支出超過400億美元,可能會受投資者更嚴格檢視。Meta股價當天盤後交易下跌2.3%。
競爭對手方面,OpenAI CEO Sam Altman在社群媒體表示:「AI進步是漸進的──期待看到Meta的產品。」Google DeepMind則保持沉默。AI研究者Timnit Gebru強調安全性,發文表示:「性能不只是基準;延期突顯急著推出尖端模型的風險。」
這並不是Meta第一次AI方面遇到困難,Llama 3在2024年因版權訓練資料庫爭議也延後發表。AI競爭加劇,Avocado失誤顯示不妥協可靠性又要使AI模型有飛躍性進步的挑戰有多大。
(首圖來源:Pixabay)






