焦慮的火山引擎,不願再苦等字節跳動的大語言模型

作者 | 發布日期 2023 年 05 月 19 日 8:10 | 分類 AI 人工智慧 , 中國觀察 line share follow us in feedly line share
焦慮的火山引擎,不願再苦等字節跳動的大語言模型


40 多個大模型千帆過盡後,最具大語言模型土壤地位的中國科技公司字節跳動,仍然沒有公布自研大語言模型的進度表。

所有人都在關心字節跳動開發大語言模型的進展,它卻沉默不語,最新消息只是闢謠140萬美元天價年薪挖角OpenAI團隊研發成員的傳聞。但字節跳動對大語言模型如此低調,更顯出旗下火山引擎有多張揚。

粗暴的計算題

與所有雲端廠商一樣, 大語言模型競爭是存在感不強的火山引擎現在最想講的故事。不久前火山引擎第一場發表會,總裁譚待拋出一番「七成大語言模型使用者都在火山引擎」言論,但因沒有同行做過統計,於是不自研大語言模型的火山引擎,突然成為離眾人最近的一朵雲。

「七成大語言模型客戶」這說法像極飛書「先進企業,先用飛書」口號,第一次出現在火山引擎發表會的MiniMax就是後者希望建立的「先進企業」標竿,這擁有三個自研foundation model(基礎模型),短短四個月完成Glow──針對大眾的AI虛擬社交App──的目標百萬用戶團隊,是業界人士看好中國少數能完成大語言模型甚至AGI的新創之一。

MiniMax顯然是七成中最重要的客戶,但譚待發言露出明顯倉促感:「等MiniMax把大語言模型做好,我們會和他們一起開發對外服務。」換句話說,火山引擎招攬大量大語言模型客戶合作的想法很像AWS,盡可能在研究早期拉攏客戶,再等著會否出現下一個Stability.ai或Anthropic。

只不過這「七成」中,也不乏崑崙萬維這種市場警告多次的「先進企業」。

崑崙萬維4月10日宣布推出大語言模型「天工」3.5,喊著「對抗ChatGPT」、「中國第一個真正實現智慧湧現」的國產大語言模型口號,首次直播展示時卻發生表格統計這種低階錯誤,且一直遭市場懷疑有蹭ChatGPT炒作之嫌,3月和4月連續收到深交所關注函和監管函。但股價近月翻了一倍。

中國大語言模型概念股的早期泡沫隨著AI一起出現,東方財富「ChatGPT」區塊2月初只有29支股票,短短兩個月就超過60支。

「早期」本身就代表不確定性,火山引擎強調的「七成」更像空中樓閣。譚待解釋這數字怎麼來的也很簡單:「火山引擎的大語言模型客戶數為分子,以市面某大語言模型名單當分母,結果就是70%。」

但多少公司轉瞬即逝,又有多少能為火山引擎增長背書,現在都沒有答案,甚至因火山引擎力推多雲架構,是否只要部分使用火山引擎者就算雲上部署大語言模型的客戶,都不清楚。

火山引擎在急什麼?

即便知道現在做計算題太簡單粗暴也為時尚早,火山引擎也要把握空窗期。一方面是競爭越發激烈的雲端市場,火山引擎不算老人也不算新人,但想當中國「第四朵雲」顯然遙遙無期。

中國企業級SaaS市場規模從2018年開始三年近50%增速,火山引擎2020年上場,從SaaS層產品和行銷端進入市場,並幾年內快速建立形象:

2021年火山引擎第一次發表雲端基礎、影片及內容行銷、數據中台、開發中台、人工智慧等五大類78項服務全系列產品。這年火山引擎地位幾乎與抖音、飛書等平行,也是第一次觸及IaaS級雲端服務。

高升至字節跳動六大BU一年後,2022年火山引擎雲端服務涉及領域確定為金融、汽車、消費、文娛、醫療、通訊傳媒六大行業,基於雲端底座推出一系列產品解決方案, 企業上雲與智慧行銷為核心方向。

也是2022年開始,火山引擎開始細化「影音雲、內容雲」等SaaS產品,並用「火種計畫」、「燈塔計畫」等招攬新長尾使用者。但這場圍繞SaaS的快速布局,艾瑞諮詢報告顯示,中國SaaS市場規模增速2021年就降至不到40%,隔年進一步跌到9.5%。

雖然中國IaaS+PaaS市場增速近年同步放緩,但2022上半年仍維持超過30%增速,代表中國雲端市場仍以IaaS+PaaS為主。SaaS先行,IaaS+PaaS跟進策略切入雲端市場的火山引擎,三年過去卻沒有預期增長快速。

IDC的2022下半年中國雲端市場調查,阿里雲、騰訊雲、華為雲、中國電信及AWS合計在中國IaaS及IaaS+PaaS市占率裡就占約73%,火山引擎只是藏在不到三成的「Others」內。

中國核心雲端商,阿里雲有最完整產品布局,且占據中小企業雲端市場;華為雲的政界領域優勢明顯;騰訊雲背後有微信靠山,且火山引擎最擅長的影音解決方案領域,2021年就涵蓋中國90%此類用戶。

三年後,火山引擎的模樣仍不夠清楚。

而火山引擎的定位問題在整個字節跳動ToB策略上彈跳,ToB業務幾乎都是從服務字節跳動本身業務開始講故事,如飛書:

字節跳動成立初幾年,試用國內外所有主流辦公軟體,沒有一個完全滿足公司需求。基於「生產力工具缺乏改革、工具不應控制人而要激發人、B端產品應有和C端產品同樣友善的用戶體驗」三方面思考,字節跳動開始飛書專案。

也如火山引擎:

字節跳動用過全球幾乎每朵公有雲……字節跳動敏捷開發和數據驅動能力透過火山引擎的雲端基礎、開發中台、數據中台、A / B測試等產品開放企業用戶。

這故事前期邏輯順暢,字節跳動的效率標籤也夠有說服力,但字節跳動本身屬性及業務形態自然為火山引擎預設了框架,而現在框架變成桎梏。火山引擎早期選擇SaaS層服務避開基礎設施苦戰,是出發時優勢,雲端原生技術及數據驅動的技術路線也經字節跳動大量驗證──以前是頭條,現在是抖音。

但這引發火山引擎更大焦慮:困境背後是字節跳動這家公司的變化,越來越像完全由抖音驅動的網路公司。這深刻塑造火山引擎業務,是成就也是限制。

僅四年就突破6億日活躍用戶的抖音今天是字節跳動幾乎所有新業務(直播、電商、本地生活等)的起點,同樣影響火山引擎產品運算方向,如側重行銷能力的汽車雲,應付影音化需求的SaaS產品視頻雲,強調內容創作到行銷及經營全流程的內容雲等。

但火山引擎從抖音出發的產品策略並沒有太多優勢。

「除非火山引擎有跨越時代的雲端技術,且恰好有很多公司需要,不然我們不會破壞現在穩定的雲端架構。」某國企技術部經理去年對媒體表示。他看衰火山引擎的原因就是網路屬性太強,這回答恰好打中字節跳動ToB業務錯位的痛點。

火山引擎目前主要客戶仍來自網路業,無論最近推動的內容雲或視頻雲,或字節跳動推崇的A / B測試DataTester,本質上火山引擎服務完全針對網路企業雲端服務,是基於字節跳動的網路公司背景,但雲端市場有更多傳產客戶。更泥濘的雲端服務場景,如生產時只要求效率,沒有太多網路公司視角的技術驅動精英邏輯,只有務實、謹慎和巨大轉移成本。

對更「傳統」的雲端需求來說,火山引擎的效率標籤沒那麼重要,甚至字節跳動都是沒有太多參考價值的公司──跳出純網路公司框架,火山引擎才能解放,許多同行都能證明。對手紛紛以各種雲端業務以外集團業務深入敵陣,火山引擎的ToB領域卻缺少後發者的著力點。

當火山沿用字節跳動一切toB業務邏輯:體內孵化驗證,然後推向市場,卻發現放眼望去,字節跳動ToC業務,教育版圖短期難擴,遊戲業務進展不順,TikTok雲端限制重重,除火山引擎外的五個BU死了四個,還是抖音獨大。

景況似乎陷入死循環,與依賴抖音取得雲端計算的優勢相比,今日火山引擎顯然更期待大語言模型的徹底改革。但就像缺席發表會的字節跳動大語言模型,中國早進入AI大戰,字節跳動卻遲未推出明確的大語言模型技術和商業模式。

過去字節跳動以扁平化組織和快速反應著稱,現在看來動作遲緩到難以想像。因字節跳動已徹底不同:兩年前業務線BU化改革後,字節形成不再扁平的結構,在中國各新業務增長困境下,逐漸演化成以大抖音為超級核心的單腳模式,無論重點開拓的本地生活戰線,還是併購的外部團隊,以及遇到困境的現有業務,尋找解套方法時,都只能靠抖音有高大壁壘的成熟業務,和流量為核心的既有資源。

待在堡壘繼續挖寶的誘惑有多大,快速行動抓住充滿挑戰的新機遇的動力就有多低。看著微軟Azure和OpenAI相互成全、阿里雲和百度雲爭相用自家大語言模型吸引新客戶,火山引擎哪怕倉促,也要用簡單粗暴的計算題定位自己,透過「催熟」外部代表性路線來刷存在感,因它知道只能靠自己抓住機會了──別人的延遲滿足,就是自己的時不再來。

(本文由 品玩 授權轉載;首圖來源:火山引擎