做為開源大模型的頂樑柱,Llama3 正在遭遇冷落。
近日,根據美國媒體The Information報導,Llama在全球最大的雲端運算服務供應商亞馬遜的AWS平台上備受冷落。與之相對,Anthropic的閉源模式Claude才是該平台上最受歡迎的模式。報導稱,在另一家雲端平台微軟Azure上,Llama也並非微軟的銷售首選。
一個月前,Meta發布了最新的開源大模型Llama 3.1 405B,在測試中效能追平GPT-4o。可惜,評估中的優異成績沒能反映在市場上,據報導,Llama3.1上線一個月後,下載量僅360萬,比上一代模型降低了40%。
門檻高效率低,開源模型「才是最貴的」
這現象早有預兆。早在今年4月,Llama 3推出70B和400B模型之後,就有開發者反饋「免費的才是最貴的」,Llama 3「根本用不起」的現象。
當時,一位美國AI創業家Arsenii Shatokhin的採訪影片在網路上流傳,這位創業者表示,「我們只有一兩個客戶有足夠資源,來精調或運行700億參數的Llama開源模型」。
訪談中,這位AI智慧體公司VRSEN的創辦人指出,企業自己運行開源大模型的效率遠低於使用閉源大模型。他分析出兩個原因:
首先,開源模型多數需要企業自行下載後運行,隨著模型參數向百億、千億不斷攀升,對本地IT設施要求也隨之提高,大量企業並不具備與之匹配的充足資源。
其次,與做好精調和商業化適配的閉源模型不同,如果使用開源模型,企業還要再做優化,需要公司內部有足夠的技術人才和技術設施,對企業的技術能力無疑是提出了更高要求。
「我們只會向具備資料專業知識的客戶推銷Llama,例如內部有工程師和資料科學家的公司」,根據The Information通報中,微軟員工這樣向媒體表示。
正如百度創辦人李彥宏在近期的上海世界人工智慧大會上表示,開源模式在學術研究、教學領域有一定價值,能夠讓學術界更熟悉大模型的工作機制、形成理論;但在大多數的應用場景中,開源模型並不合適,尤其是在激烈的商業化競爭中,只有閉源模型,才能讓企業的業務效率更高、成本更低。
缺乏商業驗證,開源模式將越來越落後
近期,開源與閉源模式之爭一直備受業界關注,尤其是在時時更新的「測評跑分」上,每當新一代大模式誕生、領跑測評榜時,就會爆出「開源大模式超越閉源」或「閉源大模型保持領先」的各類說法。
但迄今為止,閉源模型效能整體領先開源。在史丹佛大學7月公布的大規模多任務語言理解(MMLU)測試排名中,排名前十的模型中,僅有Llama 3.1為開源,其餘9款上榜模型均為閉源。
(Source:Stanford CRFM)
某種程度上,這與開源模型並非「真開源」有關。有多位開發者表示,目前的開源大模型並非與開源軟體不同,僅僅是開放了參數和調用接口,在使用中既存在需要SFT精調、優化的問題,還無法像真開源的Linux那樣看到底層代碼。
因此,大模型的開源並不能帶來模型效果的提升。 「開源模型和閉源模型相比,存在效能差距,這種差距將繼續擴大。」CEO施密特在Google前指出。據介紹,Google投資的法國Mistral公司先前推出開源模型,但從今年2月起,已經轉向了閉源模型。
在實用性方面,伴隨著Llama 3的「叫好不叫座」,開源模型更是與閉源模型拉開了差距。有多位開發者表示,大模型的進步與實際應用密不可分,只有真實應用才能持續為模型提供回饋,讓模型在反應速度、參數大小等方面不斷優化。
隨著商業化的失速,缺乏商業驗證的開源模型,勢必會逐步落後。