還記得在 2021 年 10 月,Facebook 宣布改名 Meta,表示將致力打造元宇宙(Metaverse),但成果讓投資人、消費者大失所望。雖然 Meta 推出的虛擬實境平台「地平線世界(Horizon Worlds)」,朝實現元宇宙邁進了一步,但畫面糟糕、世界無聊,使用者寥寥無幾。Meta 董事長兼執行長祖克柏(Mark Zuckerberg)在地平線世界裡的虛擬替身更遭眾人嘲笑,讓人不禁認為祖克柏選錯了戰場。
沒想到 2023 年,Meta 發布名為 Llama 的開源大型語言 AI 模型再次迎頭趕上。據《財星》(Fortune)報導,該模型在開源 AI 社群 Hugging Face 等網站的下載量已逾 6 億次,超過九成的開源模型以 Llama 為基礎。
Meta 的 Llama 模型從外洩乾脆轉為免費使用
Meta 在 2013 年就投入 AI 領域,由「卷積神經網絡之父」楊立昆(Yann LeCun)帶領 FAIR (Fundamental AI Research)實驗室。2022 年 11 月推出名為 Galactica 的學術機器人,但該機器人卻常給出錯誤的答案,震驚眾多學者,當時更遭批評「是 Meta 迄今為止製造的東西中,最危險的一個」。
在 Meta 關閉 Galactica 的 12 天後,OpenAI 發布的 ChatGPT 在全球颳起旋風;FAIR 則潛心研發 Llama 模型,擔心再被批評,Meta 一開始僅提供少數人權限使用,不料,數周後模型外洩。原本 Meta 計畫要求相關網站移除外洩的模型,但後來祖克柏 2023 年 7 月 18 日宣布免費供 Llama 2 研究、商業使用,而這也成為 Meta 逆轉勝的關鍵。
「開源」成為 Meta 快速趕上對手的關鍵
有不少學者在當時呼籲 Meta 讓 Llama 成為開源模型,楊立昆表示,許多人認為開源極具價值,讓外界取得測試、檢查模型運作的權限,有助各個產業開創新生態。FAIR 的研究人員則認為,開源 Llama 2 可用更低的成本,讓模型更快地變強大。祖克柏得知後,評估開源不會影響公司經營,再加上不希望出現只有少數企業掌控 AI 的局面。他最終決定讓研究、開發人員和其他使用者存取底層程式,且能決定模型如何處理資訊,以便改進模型。2024 年發布的 Llama 3 模型,其速度和準確性與 OpenAI 和 Anthropic 的最強模型並駕齊驅,甚至可以勝過這些對手。
卡朱里亞形容祖克柏將 Llama 做為開源模型是一項「天才之舉」。透過開源,有助於吸引頂尖人才,讓平台加速創新並開發新的收入來源,延長平台壽命。她表示,擁有成千上萬的開發人員協助糾錯、改進 Llama 模型,讓 Meta 快速趕上 OpenAI、Google 和 Anthropic。「如果沒有開源,(Llama)可能要花更久的時間,才能跟其他先進的模型相提並論」卡朱里亞說道。
開源 Llama 實力強大但商業模式未明
研究機構沃爾夫(Wolfe Research)的分析師施韋塔‧卡朱里亞(Shweta Khajuria)推估,運用 Llama 開發的 Meta AI 功能,幫助品牌商投放廣告。此外,外界推測 Llama 模型未來可能推行付費制,助攻 Meta 營收。然而實情是,Meta 已花數十億美元打造 Llama 模型,並預估 2024 年的資本支出將高達 400 億美元,且 2025 年的支出可能還會大幅增加,目前仍免費提供給高盛(Goldman Sachs)、AT&T 等上千家公司使用,獲利模式仍有待發展。哈斯商學院副教授阿比謝克‧納加拉吉(Abhishek Nagaraj)便表示不解開源 Llama 的商業利益,因為從純粹的經濟學角度來看,Meta 投入成本打造模型,卻免費提供企業使用,難以獲利。卡朱里亞亦示警,2026 年,Meta 營收如果沒有加速成長,「投資人將失去耐心」。
此外,部分人士擔心開源引發危機。中國已運用 Llama 開發軍用 AI 工具,而唐納‧川普(Donald Trump)再次當選美國總統,肯定不希望其他國家取得美國製造的先進 AI 模型。外界因此擔心可能加劇地緣政治緊張、軍備競賽,Facebook 共同創辦人達斯汀‧莫斯科維茨(Dustin Moskovitz)也表示自己不反對開源 Llama,但 Meta 不應再釋出更強大的版本。
(本文由 經理人月刊 授權轉載;首圖來源:shutterstock)