大語言模型讓 Databricks 和 Snowflake 開打:逼開發者選邊站

作者 | 發布日期 2023 年 06 月 15 日 7:50 | 分類 AI 人工智慧 , Big Data line share follow us in feedly line share
大語言模型讓 Databricks 和 Snowflake 開打:逼開發者選邊站


大模型風潮不可避免颳到大數據業,火藥味還不小。這不快臨近有人注意到,兩家大數據業「宿敵」Databricks 和 Snowflake,今年雙雙把一年一度最重要峰會定於同時段:6 月 26~29 日舉辦。這可是這麼多年都沒有過的事。

不僅如此,兩家還不約而同今年大會主題都定為AI。Databricks直接取名叫「Data+AI Summit」,官網點進去就是大大的「Generation AI」標題:

Snowflake也取了很流行的標題:「全球最大數據、App和AI主題大會」:

這說明兩家公司明目張膽逼與會者選擇:去完對面大會再來我們這,恐怕來不及喔。

兩家公司一家在舊金山,一家在拉斯維加斯,開車要9小時,飛機也得1個半小時。有興趣者想魚和熊掌兼得,絕對要花錢花時間花精力。重頭戲來了,不僅時間重疊,兩家還各請到重量級來賓發表主題演講:Databricks請來微軟CEO薩蒂亞·納德拉(Satya Nadella),Snowflake則是輝達CEO黃仁勳。

網友提醒大家,兩家峰會同時間舉辦,「如果你還沒選邊站,那麼現在就是選擇的時候了」。

當然也有準備兩邊跑的人。Striim公司產品經理John Kutay就兩大會都有演講,不過也「評估拉斯維加斯到舊金山路程和時間」。還沒做決定的網友問他Databricks演講內容會是啥:「我想去,但到時候還得趕去SF,唉。」

有網友做了離譜的夢:「剛夢到所有人都在Snowflake大會感染新冠,因Snowflake不想讓我們參加Databricks峰會……」

Snowflake和Databricks都是大數據分析公司的佼佼者。前者2021年創辦,2020年9月上市,上市首日收盤股價飆升111.6%,收253.93美元,為美國有史以來規模最大軟體IPO。Snowflake股東名單不乏Salesforce和巴菲特等大名鼎鼎投行。

創辦於2013年的Databricks是一級市場超級獨角獸,2021年連獲兩輪10億美元高額融資,估值高達380億美元。中國業者習慣稱它「磚廠」。

兩家不僅常被外界比較,彼此也各種明暗較勁。最有名的喊話是2021年,眼看Snowflake靠雲端資料倉庫就做到千億市值,Databricks坐不住了,發文稱數據湖技術創下TPC-DS基準測試紀錄,還強調第三方研究實際性能可達Snowflake的2.5倍。

接著過了十天,Snowflake回應,公布測試結果,同時稱Databricks性能比較結論不夠完整,研究本身就有缺陷。Snowflake創辦人還強調這基準測試沒什麼意義,這年代公布資料庫基準測試結果是「將正常技術交流變成缺乏完整性的行銷噱頭」。

不甘心的Databricks再次回應,創辦人於部落格發文,是更嚴重的指控:Snowflake為了測試結果竟然更改TPC-DS輸入數據。

之後兩家互嗆就沒停過。

2022年和投資人Matt Turck對談,Databricks聯合創辦人兼CEO Ali Ghodsi還不避諱談到與Snowflake的競爭。他先商業性誇誇Snowflake有「可能是市場最好的數據倉庫」,且「Databricks與Snowflake共存可能70%客戶」。

Snowflake主要技術是數據倉庫,Databricks是數據湖,也是兩家技術最主要的不同點。接著Ali Ghodsi就宣傳自家數據湖,「公有雲計算供應商有動力推動更多人資料存到他們的數據湖……我認為數據湖模式將獲勝」。

產品性能你追我趕還沒完,現在Databricks和Snowflake又暗地較勁大模型。

Databricks 3月公布「Dolly」(據說是致敬第一隻複製羊多莉)開源大語言模型,稱「只需30美元、一台伺服器和3小時,我們就能教Dolly與人類互動」。這擺明針對ChatGPT等門檻更高產品,意思就是AI不再只有大型科技公司才負擔得起,不用太多融資,任何人都能開發出像人類的AI。Databricks接著又在4月公布大語言模型開源反覆運算版Dolly 2.0。

Snowflake也不斷炒作大模型,4月發文稱生成式AI和大語言模型搭建以數據為中心的平台,並詳細解讀這麼做的依據和影響。5月Snowflake宣布收購新創公司Neeva,以數據雲端平台添加基於AI的搜尋。

雖然AI大模型兩家公司還沒有踏進對方領域,不過這次年度峰會舉辦時間重疊已說明態度。有趣的是,有人在Google搜尋Snowflake conference,第一個結果卻是Databricks大會連結,其次才是Snowflake。等於Databricks買競爭對手關鍵字,賣自己的廣告。

Google搜尋輸入「Databricks+Snowflake」,前兩條都是廣告(這結果是動態展示)──Databricks依然在競價排名的第一位置宣傳成績,但第二是某家技術服務商,宣傳幫客戶遷移到Snowflake服務,甚至比兩家直接競價更有意思,Databricks依然可解讀為(商業攻勢)進攻性更強、更有戰鬥力,但兩家競爭時某些技術服務商也尋找商機,且似乎更認為轉移到Snowflake需求更大。

不論如何,一場大戰又要開打了。現在大模型領域不缺參加者,到了Databricks和Snowflake這,或許就變成誰先幹掉誰的問題。

(本文由 品玩 授權轉載;首圖來源:Snowflake / Databricks