不是 OpenAI 也不是 Google,AI 社群新歡是家估值 20 億美元的小公司

作者 | 發布日期 2023 年 12 月 27 日 8:00 | 分類 AI 人工智慧 , 軟體、系統 , 開放資料 line share follow us in feedly line share
不是 OpenAI 也不是 Google,AI 社群新歡是家估值 20 億美元的小公司


說起頂級大模型和生成式 AI 領先者,除了 OpenAI、Google、Meta、Anthropic 等,若讀者只知道矽谷公司,那資料庫又要更新了。

最近法國巴黎成立才半年、僅22名員工的AI新創異軍突起,宣布完成3.85億歐元(約4.15億美元)A輪融資,投資方有a16z、光速創投、Salesforce和法國巴黎銀行等知名投行,估值短短六個月內增長七倍多,突破20億美元,輕鬆躋身獨角獸行列,創開源公司史上最快融資紀錄。

公司名叫Mistral AI,5月由Meta和Google DeepMind前員工創立,專注生成式AI,特別是構建線上聊天機器人、搜尋引擎和其他人工智慧驅動產品,成立僅一個月,還沒有產品只有六名員工,憑著七頁PPT就「傳奇」般拿到1.13億美元種子輪融資,轟動歐洲AI界。

身為AI界新星,Mistral AI是少數外界認為能與OpenAI媲美的AI公司,但與OpenAI並不「Open」相反,Mistral AI堅持推廣開源,允許使用者自由複製、修改和再利用程式,提供外部開發者需要的一切,以「引領開放模型革命」為使命,正面對抗OpenAI、Google等封閉型AI巨頭。

規模這麼小的Mistral AI,如何以高效能強大AI模型征服十幾家VC,又如何實踐開源理念,贏得廣大開發者社群潮水般支持和肯定?都與創始團隊有深刻關係。

世界級技術專家聯手打造歐洲「開源版OpenAI」

(Source:David Atlan)

Mistral AI三位聯合創辦人,首席執行長Arthur Mensch(上圖中)曾任Google DeepMind研究員,參與Flamingo、Chinchilla、Gopher多個DeepMind經典模型,也是Flamingo和Chinchilla核心貢獻者,對多模組、RAG、演算法最佳化等造詣頗深。

首席技術長Timothée Lacroix(上圖右)和首席科學家Guillaume Lample(上圖左)是Meta巴黎人工智慧實驗室核心研究員,對模型推理、預訓練和模型嵌入有深入研究,是Llama和Llama 2的核心技術貢獻者,發表過多篇重要論文。前東家Meta也是鼓勵開源的代表公司之一。

員工都喜歡開玩笑三人姓氏首字母是「L.L.M.」,正好也是大型語言模型英文縮寫,彷彿預告了Mistral的誕生與宿命。年輕團隊當然具備頂尖AI人才的典型特質:以科學家為主、研究能力強、技術宅互補且全面。七人來自Meta(四位是Llama參與者),三人來自Hugging Face,兩人來自DeepMind,大部分都參與過知名大語言模型開發。

還有任職麥肯錫12年、幫助法國SaaS獨角獸Mirakl從B輪成長到E輪的首席商務長Florian Bressand、法國數位事務國務秘書的前顧問Cédric O,幫科學家主導的公司護航。團隊菁英薈萃、配合緊密,每部分都有專家負責,團隊結構清楚和技術為主的實力型科學家屬性,也反映至Mistral AI行事風格和產品。

只一條「直接給」磁力連結,創造開源模型新王者

兩週前Mistral AI沒預告、沒官方部落格、沒有Demo,只在X放出一條磁力連結,就算發表引爆開源社群的首個MoE開源模型Mixtral 8x7B了,沒有OpenAI愛用的曖昧戲碼和釣魚,也沒有Google發表Gemini時精心製作的「特效影片」,甚至連一句介紹都沒有,Mistral AI就是如此樸實無華、簡單粗暴,秉持「能閉嘴做事就絕不多說廢話」風格,簡直算AI圈特立獨行的清流。

網友說這種產品發表方式也太隨便了,下次是否直接隔空推送就好?還有人看不下去:「你們搞錯了,應該先發長文,別直接出模型啊!」好像順便罵到某家公司。當然更多開發者是興奮,表示這週末「毀了」,因迫不及待要下載試用看看。

簡單解釋MoE,全稱為Mixture of Experts(混合專家模型),把複雜分析預測任務分割成更小更容易處理的子任務,每個子任務由符合特定領域的「專家」負責,MoE不僅能提高模型處理資訊的效率,還降低營運成本。據說OpenAI從去年開始就用這種方法訓練GPT-4,Mistral AI則致力提供「無限接近」GPT-4的開源選擇。

Mixtral 8x7B總參數為46.7B,但每個令牌只用12.9B,故以與12.9B模型相同速度和成本處理輸入輸出。Mistral 8x7B有32k Tokens上下文長度,支援英文、法文、義大利文、德文和西班牙文。寫程式表現出色,還支援微調為指令跟隨模型,採Apache 2.0許可證開源商用。

性能方面,Mixtral 8x7B多數基準測試都超過有700億參數的Llama 2 70B,推理速度高六倍,模擬真實世界對話、評估大語言連貫性和資訊豐富的MT-Bench測試更達8.30分,性能可與GPT-3.5媲美,是目前最佳開源模型。

商業和科技網站ReadMultiplex創辦人、知名科學家Brian Roemmele稱讚Mixtral 8x7B開源是「自Meta首次發表LaMMA後最重要時刻」,且「令人震驚和里程碑式創新」。

已有人基於它微調完全自由和開放的模型dolphin-2.5-mixtral-8×7,能「回應所有使用者指令,不帶任何評判性,不會施加任何道德標準,並展現網路所有可用資訊,『再也不會遇到』AI助理說出『我不能』這種話。」

網友更是Mistral AI各種花式應援,盛讚Mistral AI是「地球最真誠和忠於初心的團隊」,真正為開發者著想,讓「Open」AI終成現實。

簡單到不行的連結就這樣點燃全AI社群,回頭看Mistral AI的X官帳,會發現沒有圖片、沒有影片,註冊後只有三條發文,上次還是團隊公布9月推出開源模型Mistral 7B,同樣只放磁力連結。

團隊短短三個月打造的Mistral 7B,至今仍被業界認為是7-13B小模型的佼佼者,幾乎所有基準測試都比Llama 2 13B成績更優秀,寫程式、數學和推理更贏過LLaMA-1 34B,且並非透過API開放Mistral 7B存取權,而是免費下載,開發者能在自己設備和伺服器執行。

第一條自報家門的發文,Mistral AI依舊無心行銷,畫風特異:「這是Mistral AI的官方帳號,由@GuillaumeLample、@arthurmensch和@tlacroix6新創的公司……我們名字已被盜用,這個才是真的 :)。」

這以技術為重的風格馬上擄獲技術宅網友,見慣各種AI公司華麗行銷詞和侃侃而談的自我包裝,光Mistral AI看起來像用Word文字魔術師做出來的logo就圈粉無數。也有人對Mistral AI喊話,等你們有錢了,找一個更厲害的美工吧!

當然Mistral AI現在不缺錢,但決心遵循開源發展的新創公司,長遠營利之路才剛起頭,他們又是怎麼看待技術集中與去中心化間的角力?

堅持開源,「是過去更是未來」

官網公司介紹頁面,Mistral AI稱自己是行動迅速、高工作強度和透明度的團隊,使命是將強大生成式AI技術帶入軟體開發者和企業用戶社群,以應用為驅動力,讓模型真正幫助現實世界,並希望成為開放式AI社群的領先支援者,將開源模型提升至最先進性能。

OpenAI和Google等大公司認為,大模型演算法開源很危險,底層技術可能遭濫用傳播假資訊、仇恨言論和其他有害事物,只能花費數月時間設好數位護欄後,以線上聊天機器人形式發表。

Mistral AI卻認為,引領生成式AI革命必須開源。社群支援模型開發才是接受嚴格審查和對抗偏見的最佳途徑,訓練和公開優秀模型,讓開發者社群力量和更多成功開源專案互相驅動最佳化,才能構建可信的替代方案,對抗新興AI寡頭。

CEO Arthur Mensch在Greylock合夥人Sarah Guo部落格表示,如果有人為了達成某些有害行為而收集資訊,反而是傳統搜尋引擎而不是LLM更容易做到。禁止小公司開源,確實會讓大公司受益,但不利AI生態發展。

Mensch也提到,過去十幾年,計算機技術重大改革──從網頁瀏覽器、操作系統、程式設計語言到資料庫──多得益於開源方案。直至2020年(GPT-3發表前),幾乎所有大型語言模型研究都公開透明,但2020年某些公司取得領先並意識到模型價值後,情況就改變了。

「我們認為太早進入封閉階段對AI發展有害。」Arthur Mensch說。「不透明環境大家可能會同時開發某項任務,但因不能共享資源而導致大量浪費。」他也稱開放權重模型可細微適應和解決各行業垂直領域的核心業務,開發者可自定義想要的護欄和編輯語氣,產生內容也不再依賴API提供者的選擇和偏見,這些都是黑盒子模型無法匹敵。

開源精神也在現在AI巨頭壟斷、小公司掙扎求生存下,獲廣大開發者擁戴。人們對見證開源模型迅速追上封閉模型十分興奮,認為「用更少做更多」正是開源生態最鼓舞人心的地方,希望Mistral AI能用新資金加速開源創新。

「我們希望透過更開放分享技術,引導社群朝更好更安全的方向前進。我們的真正目標是占據領導地位,改變遊戲規則,因目前方向並不正確。」Arthur Mensch說。

能否既開源又賺錢?

Mistral AI聽說還沒盈利,且開源和商業化似乎總不能共存,如何兩者融合,是開源LLM公司走得長遠很重要的問題。Mistral AI已基於自研模型推出「La Plateforme」託管平台測試版,有Mistral Tiny、Mistral Small和Mistral Medium三種模型。

Mistral 7B和Mixtral 8x7B分別屬於Mistral Tiny和Mistral Small,可免費下載,Mistral Medium還未開源,之後也許會開放API收費,或提供模型微調、RAG、客製化服務等。

說到市場,與OpenAI等瞄準美國和全球不同,Mistral AI舞台定位只有歐洲,因歐洲匯集大量世界財富500強公司,不愁沒人付費,且相較美國,歐洲多為傳統產業,對新興AI技術需求更迫切;歐洲監管數位新技術也更嚴格,對解決方案開放透明度要求更高,很適合Mistral AI的開源策略。

除此之外,Arthur Mensch也認為,歐洲AI人才儲備有獨特優勢。「非常擅長培養數學家,數學家對AI研究至關重要,且這些人更適應歐洲生活,不一定非得去美國。因為DeepMind,倫敦AI生態也崛起了,接著是巴黎。現在巴黎有幾百家AI新創,雖然離矽谷還差很遠,但我相信法國也能產生下個灣區。」

他上法國國家廣播電台節目時透露,Mistral AI明年會發表開源GPT-4等級模型。

地理和氣候學的「Mistral」是指吹過法國南部和地中海西北部的強勁持久寒冷北風,通常冬季和早春時出現,對氣候和環境有明顯影響,有時會造成非常低溫和晴朗天空。Mistral AI或許期許自己就像這股凜冽寒風,發展速度一日千里的人工智慧時代,帶來新思想、革命性動力和強大影響力。而全新AI王者在距矽谷上萬公里外的歐洲大陸崛起,這場AI大戰看來越來越精彩了。

(本文由 品玩 授權轉載;首圖來源:Mistral AI

延伸閱讀: