
AI 的競賽,正從比賽更強大的演算法或更快的晶片,走向下一階段。一家快速崛起的新創公司 Scale AI 告訴我們,關鍵勝負其實藏在另一個不起眼的環節──誰能掌握最優質的「數據原料」。
科技巨頭Meta在6月中斥資143億美元(約合新台幣4.3兆元),完成對Scale AI的戰略性投資,取得其49%的股權,讓這家新創公司估值躍升至290億美元。這將是Meta史上第二高的收購金額!
此外,Scale AI創辦人、年僅28歲的汪滔(Alexandr Wang)也被挖角,加入Meta新成立的「超級智慧」AGI部門擔任領導者。
AI要變聰明,得給它能看懂的資料
為何Meta要斥重金拿下Scale AI?AI世界的3大基礎支柱是演算法、算力與資料。過去幾年,人們把目光集中在大型語言模型如GPT的創新、輝達GPU的市值暴漲,卻忽略了:沒有大規模、高品質且不斷更新的「資料」,即使再強的模型也無法持續進化。
Scale AI鎖定的就是第3根支柱,專門為AI模型準備學習用的資料。這個過程叫做「資料標註」,意思是幫一大堆圖片、文字或音訊加上說明,讓電腦能看懂這些資訊。
舉例來說,如果AI要學會辨識紅綠燈,就需要先讀過很多圖片,每一張都要有人標記出「這裡是紅燈」、「那裡是行人穿越道」;如果要讓AI懂人類情緒,就要先提供大量文字資料,並告訴它哪些語句是開心的、哪些是憤怒的。這些細節標註越精準,AI學得就越快越準。
Scale AI把這件事變成一門規模化的生意。透過其「數據代工廠」(Data Foundry)的理念,結合大量人工標註員,以及機器輔助系統,建立了一套可快速處理、又能保證品質的資料生產線。他們服務的對象從商業科技公司到美國國防部,還和Meta一起開發「國防Llama」這類軍事語言模型,顯示其資料處理能力受到高度信任。
這樣的資料供應實力,也反映在營運成績上。2024年公司營收為8億7千萬美元,預估今年將成長一倍以上,突破20億美元。
Scale AI包辦最完善「資料代工」
傳統的資料清洗與標註公司,多半提供的是工具平台或單次型的外包服務,由企業自行上傳資料、指派工作、管理品質。Scale AI與這些公司不同的是,它提供的是一種「全流程託管」模式,從資料收集、標註策略制定,到最後的驗證,都由Scale AI一手包辦,並根據客戶用途提供量身定制的處理方案。
更重要的是,Scale AI不只是工具供應商,而是與客戶共同設計數據策略的夥伴。它的模式更像「資料顧問+標註工廠」,同時處理質量控管、安全需求與資料更新機制,這讓它在高度敏感或要求極高的場景(如軍事語言模型)中能獲得信賴。
這也解釋了為什麼Meta願意投入鉅資來換取合作。這不只是一筆單純的投資,而是為了確保未來能掌握一條獨占的資料供應鏈。在晶片與模型都可能模仿的年代,資料處理流程的密集人力、複雜管理與多語料庫來源,反而成為最高的門檻與護城河。
Scale AI的角色類似台積電之於半導體產業。台積電的晶圓代工服務,因為品質佳,業界甚至沒有其他選擇,轉變成各個大廠爭搶的戰略合作夥伴。Scale AI 不只交付資料,更主導資料的結構、更新頻率與標註策略,完整的服務,導致很多AI大廠已經對它高度依賴。
Meta持股49%收購引發中立疑慮
然而這場交易也引來大量質疑。Scale AI原為OpenAI、Google、微軟等多家大型AI實驗室的資料供應商,如今卻成為Meta持股49%的公司。這讓市場出現擔心:這家曾經「為所有人服務」的資料煉金師,是否仍能保持中立?根據《路透社》報導,Google正計畫終止與Scale AI的合作,微軟、xAI也可能退出。
在生成式AI成為主流的今日,企業若能掌握穩定、高品質、具前瞻性的數據來源,不只能提升模型效能,更能在激烈競爭中占據長期優勢。Meta正是用百億美元下這個賭注,而Scale AI,則證明了資料煉金術,可以是一門真正的戰略生意。但它的中立性,將成為這門生意能否長久的最大考驗。
(作者:曹博凱;本文由《商業周刊》授權轉載;首圖來源:Scale AI)