Meta 因性能未達標延後推出新模型 Avocado，再發表時間未定

Meta 最近宣布，由於性能問題，延後推出最新大型語言模型「Avocado」。《紐約時報》報導，此為基準測試顯示 Avocado 推理準確性、幻覺率和多模態處理效率等關鍵領域表現不佳後決定。

Meta於Menlo Park實驗室壓力測試時，Avocado複雜數學和寫程式錯誤率比OpenAI GPT-5和Anthropic Claude 3.5高15%~20%。

Meta 1月Connect大會說Avocado是「下世代尖端模型」，並承諾消費者硬體會有更高效率，並能無縫整合至Meta生態系統如Instagram、WhatsApp和Ray-Ban智慧眼鏡。原定3月中旬開放合作夥伴首次測試，並以Llama 4（Avocado開源版）開放給大眾。

Avocado開發部門為Meta AI的Fair，基於Llama 3.1架構，採稀疏專家混合（MoE），參數達2兆，訓練資料庫為自定義的10兆標記，重點強調來自Meta平台即時社群媒體數據。2月外洩基準顯示Avocado於MMLU（89.2%對88.7%）和HumanEval（92% pass@1）略勝GPT-4o，外界開始猜測2026年上半AI主導者會是誰。

然內部備忘錄指出，微調時Meta資料中心過熱，且安全防護措施不一，使公司安全審核多花了兩週時間。Meta 12日晚間確認發表延期：「我們致力提供最高品質的AI體驗。經過嚴格評估，我們決定延長模型測試期，以確保符合標準。更多細節很快會公布。」雖然未說新時間表，但相關人士表示，最早可能第二季推出。

分析師表示擔憂，Wedbush Securities的Dan Ives稱這是大型科技公司AI競賽的「警鐘」，並指出Meta的2025年AI資本支出超過400億美元，可能會受投資者更嚴格檢視。Meta股價當天盤後交易下跌2.3%。

競爭對手方面，OpenAI CEO Sam Altman在社群媒體表示：「AI進步是漸進的──期待看到Meta的產品。」Google DeepMind則保持沉默。AI研究者Timnit Gebru強調安全性，發文表示：「性能不只是基準；延期突顯急著推出尖端模型的風險。」

這並不是Meta第一次AI方面遇到困難，Llama 3在2024年因版權訓練資料庫爭議也延後發表。AI競爭加劇，Avocado失誤顯示不妥協可靠性又要使AI模型有飛躍性進步的挑戰有多大。