Llama 3 受美國市場冷落，開源模型還香嗎？

做為開源大模型的頂樑柱，Llama3 正在遭遇冷落。

近日，根據美國媒體The Information報導，Llama在全球最大的雲端運算服務供應商亞馬遜的AWS平台上備受冷落。與之相對，Anthropic的閉源模式Claude才是該平台上最受歡迎的模式。報導稱，在另一家雲端平台微軟Azure上，Llama也並非微軟的銷售首選。

一個月前，Meta發布了最新的開源大模型Llama 3.1 405B，在測試中效能追平GPT-4o。可惜，評估中的優異成績沒能反映在市場上，據報導，Llama3.1上線一個月後，下載量僅360萬，比上一代模型降低了40%。

這現象早有預兆。早在今年4月，Llama 3推出70B和400B模型之後，就有開發者反饋「免費的才是最貴的」，Llama 3「根本用不起」的現象。

當時，一位美國AI創業家Arsenii Shatokhin的採訪影片在網路上流傳，這位創業者表示，「我們只有一兩個客戶有足夠資源，來精調或運行700億參數的Llama開源模型」。

訪談中，這位AI智慧體公司VRSEN的創辦人指出，企業自己運行開源大模型的效率遠低於使用閉源大模型。他分析出兩個原因：

首先，開源模型多數需要企業自行下載後運行，隨著模型參數向百億、千億不斷攀升，對本地IT設施要求也隨之提高，大量企業並不具備與之匹配的充足資源。

其次，與做好精調和商業化適配的閉源模型不同，如果使用開源模型，企業還要再做優化，需要公司內部有足夠的技術人才和技術設施，對企業的技術能力無疑是提出了更高要求。

「我們只會向具備資料專業知識的客戶推銷Llama，例如內部有工程師和資料科學家的公司」，根據The Information通報中，微軟員工這樣向媒體表示。

正如百度創辦人李彥宏在近期的上海世界人工智慧大會上表示，開源模式在學術研究、教學領域有一定價值，能夠讓學術界更熟悉大模型的工作機制、形成理論；但在大多數的應用場景中，開源模型並不合適，尤其是在激烈的商業化競爭中，只有閉源模型，才能讓企業的業務效率更高、成本更低。

近期，開源與閉源模式之爭一直備受業界關注，尤其是在時時更新的「測評跑分」上，每當新一代大模式誕生、領跑測評榜時，就會爆出「開源大模式超越閉源」或「閉源大模型保持領先」的各類說法。

但迄今為止，閉源模型效能整體領先開源。在史丹佛大學7月公布的大規模多任務語言理解（MMLU）測試排名中，排名前十的模型中，僅有Llama 3.1為開源，其餘9款上榜模型均為閉源。

（Source：Stanford CRFM）

某種程度上，這與開源模型並非「真開源」有關。有多位開發者表示，目前的開源大模型並非與開源軟體不同，僅僅是開放了參數和調用接口，在使用中既存在需要SFT精調、優化的問題，還無法像真開源的Linux那樣看到底層代碼。

因此，大模型的開源並不能帶來模型效果的提升。「開源模型和閉源模型相比，存在效能差距，這種差距將繼續擴大。」CEO施密特在Google前指出。據介紹，Google投資的法國Mistral公司先前推出開源模型，但從今年2月起，已經轉向了閉源模型。

在實用性方面，伴隨著Llama 3的「叫好不叫座」，開源模型更是與閉源模型拉開了差距。有多位開發者表示，大模型的進步與實際應用密不可分，只有真實應用才能持續為模型提供回饋，讓模型在反應速度、參數大小等方面不斷優化。

隨著商業化的失速，缺乏商業驗證的開源模型，勢必會逐步落後。

（本文由雷峰網授權轉載；首圖來源：Meta）

想請我們喝幾杯咖啡？