不是 OpenAI 也不是 Google，AI 社群新歡是家估值 20 億美元的小公司

說起頂級大模型和生成式 AI 領先者，除了 OpenAI、Google、Meta、Anthropic 等，若讀者只知道矽谷公司，那資料庫又要更新了。

最近法國巴黎成立才半年、僅22名員工的AI新創異軍突起，宣布完成3.85億歐元（約4.15億美元）A輪融資，投資方有a16z、光速創投、Salesforce和法國巴黎銀行等知名投行，估值短短六個月內增長七倍多，突破20億美元，輕鬆躋身獨角獸行列，創開源公司史上最快融資紀錄。

公司名叫Mistral AI，5月由Meta和Google DeepMind前員工創立，專注生成式AI，特別是構建線上聊天機器人、搜尋引擎和其他人工智慧驅動產品，成立僅一個月，還沒有產品只有六名員工，憑著七頁PPT就「傳奇」般拿到1.13億美元種子輪融資，轟動歐洲AI界。

身為AI界新星，Mistral AI是少數外界認為能與OpenAI媲美的AI公司，但與OpenAI並不「Open」相反，Mistral AI堅持推廣開源，允許使用者自由複製、修改和再利用程式，提供外部開發者需要的一切，以「引領開放模型革命」為使命，正面對抗OpenAI、Google等封閉型AI巨頭。

規模這麼小的Mistral AI，如何以高效能強大AI模型征服十幾家VC，又如何實踐開源理念，贏得廣大開發者社群潮水般支持和肯定？都與創始團隊有深刻關係。

世界級技術專家聯手打造歐洲「開源版OpenAI」

（Source：David Atlan）

Mistral AI三位聯合創辦人，首席執行長Arthur Mensch（上圖中）曾任Google DeepMind研究員，參與Flamingo、Chinchilla、Gopher多個DeepMind經典模型，也是Flamingo和Chinchilla核心貢獻者，對多模組、RAG、演算法最佳化等造詣頗深。

首席技術長Timothée Lacroix（上圖右）和首席科學家Guillaume Lample（上圖左）是Meta巴黎人工智慧實驗室核心研究員，對模型推理、預訓練和模型嵌入有深入研究，是Llama和Llama 2的核心技術貢獻者，發表過多篇重要論文。前東家Meta也是鼓勵開源的代表公司之一。

員工都喜歡開玩笑三人姓氏首字母是「L.L.M.」，正好也是大型語言模型英文縮寫，彷彿預告了Mistral的誕生與宿命。年輕團隊當然具備頂尖AI人才的典型特質：以科學家為主、研究能力強、技術宅互補且全面。七人來自Meta（四位是Llama參與者），三人來自Hugging Face，兩人來自DeepMind，大部分都參與過知名大語言模型開發。

還有任職麥肯錫12年、幫助法國SaaS獨角獸Mirakl從B輪成長到E輪的首席商務長Florian Bressand、法國數位事務國務秘書的前顧問Cédric O，幫科學家主導的公司護航。團隊菁英薈萃、配合緊密，每部分都有專家負責，團隊結構清楚和技術為主的實力型科學家屬性，也反映至Mistral AI行事風格和產品。

只一條「直接給」磁力連結，創造開源模型新王者

兩週前Mistral AI沒預告、沒官方部落格、沒有Demo，只在X放出一條磁力連結，就算發表引爆開源社群的首個MoE開源模型Mixtral 8x7B了，沒有OpenAI愛用的曖昧戲碼和釣魚，也沒有Google發表Gemini時精心製作的「特效影片」，甚至連一句介紹都沒有，Mistral AI就是如此樸實無華、簡單粗暴，秉持「能閉嘴做事就絕不多說廢話」風格，簡直算AI圈特立獨行的清流。

網友說這種產品發表方式也太隨便了，下次是否直接隔空推送就好？還有人看不下去：「你們搞錯了，應該先發長文，別直接出模型啊！」好像順便罵到某家公司。當然更多開發者是興奮，表示這週末「毀了」，因迫不及待要下載試用看看。

簡單解釋MoE，全稱為Mixture of Experts（混合專家模型），把複雜分析預測任務分割成更小更容易處理的子任務，每個子任務由符合特定領域的「專家」負責，MoE不僅能提高模型處理資訊的效率，還降低營運成本。據說OpenAI從去年開始就用這種方法訓練GPT-4，Mistral AI則致力提供「無限接近」GPT-4的開源選擇。

Mixtral 8x7B總參數為46.7B，但每個令牌只用12.9B，故以與12.9B模型相同速度和成本處理輸入輸出。Mistral 8x7B有32k Tokens上下文長度，支援英文、法文、義大利文、德文和西班牙文。寫程式表現出色，還支援微調為指令跟隨模型，採Apache 2.0許可證開源商用。

性能方面，Mixtral 8x7B多數基準測試都超過有700億參數的Llama 2 70B，推理速度高六倍，模擬真實世界對話、評估大語言連貫性和資訊豐富的MT-Bench測試更達8.30分，性能可與GPT-3.5媲美，是目前最佳開源模型。

商業和科技網站ReadMultiplex創辦人、知名科學家Brian Roemmele稱讚Mixtral 8x7B開源是「自Meta首次發表LaMMA後最重要時刻」，且「令人震驚和里程碑式創新」。

已有人基於它微調完全自由和開放的模型dolphin-2.5-mixtral-8×7，能「回應所有使用者指令，不帶任何評判性，不會施加任何道德標準，並展現網路所有可用資訊，『再也不會遇到』AI助理說出『我不能』這種話。」

網友更是Mistral AI各種花式應援，盛讚Mistral AI是「地球最真誠和忠於初心的團隊」，真正為開發者著想，讓「Open」AI終成現實。

簡單到不行的連結就這樣點燃全AI社群，回頭看Mistral AI的X官帳，會發現沒有圖片、沒有影片，註冊後只有三條發文，上次還是團隊公布9月推出開源模型Mistral 7B，同樣只放磁力連結。

團隊短短三個月打造的Mistral 7B，至今仍被業界認為是7-13B小模型的佼佼者，幾乎所有基準測試都比Llama 2 13B成績更優秀，寫程式、數學和推理更贏過LLaMA-1 34B，且並非透過API開放Mistral 7B存取權，而是免費下載，開發者能在自己設備和伺服器執行。

第一條自報家門的發文，Mistral AI依舊無心行銷，畫風特異：「這是Mistral AI的官方帳號，由@GuillaumeLample、@arthurmensch和@tlacroix6新創的公司……我們名字已被盜用，這個才是真的 :)。」

這以技術為重的風格馬上擄獲技術宅網友，見慣各種AI公司華麗行銷詞和侃侃而談的自我包裝，光Mistral AI看起來像用Word文字魔術師做出來的logo就圈粉無數。也有人對Mistral AI喊話，等你們有錢了，找一個更厲害的美工吧！

當然Mistral AI現在不缺錢，但決心遵循開源發展的新創公司，長遠營利之路才剛起頭，他們又是怎麼看待技術集中與去中心化間的角力？

堅持開源，「是過去更是未來」

官網公司介紹頁面，Mistral AI稱自己是行動迅速、高工作強度和透明度的團隊，使命是將強大生成式AI技術帶入軟體開發者和企業用戶社群，以應用為驅動力，讓模型真正幫助現實世界，並希望成為開放式AI社群的領先支援者，將開源模型提升至最先進性能。

OpenAI和Google等大公司認為，大模型演算法開源很危險，底層技術可能遭濫用傳播假資訊、仇恨言論和其他有害事物，只能花費數月時間設好數位護欄後，以線上聊天機器人形式發表。

Mistral AI卻認為，引領生成式AI革命必須開源。社群支援模型開發才是接受嚴格審查和對抗偏見的最佳途徑，訓練和公開優秀模型，讓開發者社群力量和更多成功開源專案互相驅動最佳化，才能構建可信的替代方案，對抗新興AI寡頭。

CEO Arthur Mensch在Greylock合夥人Sarah Guo部落格表示，如果有人為了達成某些有害行為而收集資訊，反而是傳統搜尋引擎而不是LLM更容易做到。禁止小公司開源，確實會讓大公司受益，但不利AI生態發展。

Mensch也提到，過去十幾年，計算機技術重大改革──從網頁瀏覽器、操作系統、程式設計語言到資料庫──多得益於開源方案。直至2020年（GPT-3發表前），幾乎所有大型語言模型研究都公開透明，但2020年某些公司取得領先並意識到模型價值後，情況就改變了。

「我們認為太早進入封閉階段對AI發展有害。」Arthur Mensch說。「不透明環境大家可能會同時開發某項任務，但因不能共享資源而導致大量浪費。」他也稱開放權重模型可細微適應和解決各行業垂直領域的核心業務，開發者可自定義想要的護欄和編輯語氣，產生內容也不再依賴API提供者的選擇和偏見，這些都是黑盒子模型無法匹敵。

開源精神也在現在AI巨頭壟斷、小公司掙扎求生存下，獲廣大開發者擁戴。人們對見證開源模型迅速追上封閉模型十分興奮，認為「用更少做更多」正是開源生態最鼓舞人心的地方，希望Mistral AI能用新資金加速開源創新。

「我們希望透過更開放分享技術，引導社群朝更好更安全的方向前進。我們的真正目標是占據領導地位，改變遊戲規則，因目前方向並不正確。」Arthur Mensch說。

能否既開源又賺錢？

Mistral AI聽說還沒盈利，且開源和商業化似乎總不能共存，如何兩者融合，是開源LLM公司走得長遠很重要的問題。Mistral AI已基於自研模型推出「La Plateforme」託管平台測試版，有Mistral Tiny、Mistral Small和Mistral Medium三種模型。

Mistral 7B和Mixtral 8x7B分別屬於Mistral Tiny和Mistral Small，可免費下載，Mistral Medium還未開源，之後也許會開放API收費，或提供模型微調、RAG、客製化服務等。

說到市場，與OpenAI等瞄準美國和全球不同，Mistral AI舞台定位只有歐洲，因歐洲匯集大量世界財富500強公司，不愁沒人付費，且相較美國，歐洲多為傳統產業，對新興AI技術需求更迫切；歐洲監管數位新技術也更嚴格，對解決方案開放透明度要求更高，很適合Mistral AI的開源策略。

除此之外，Arthur Mensch也認為，歐洲AI人才儲備有獨特優勢。「非常擅長培養數學家，數學家對AI研究至關重要，且這些人更適應歐洲生活，不一定非得去美國。因為DeepMind，倫敦AI生態也崛起了，接著是巴黎。現在巴黎有幾百家AI新創，雖然離矽谷還差很遠，但我相信法國也能產生下個灣區。」

他上法國國家廣播電台節目時透露，Mistral AI明年會發表開源GPT-4等級模型。

地理和氣候學的「Mistral」是指吹過法國南部和地中海西北部的強勁持久寒冷北風，通常冬季和早春時出現，對氣候和環境有明顯影響，有時會造成非常低溫和晴朗天空。Mistral AI或許期許自己就像這股凜冽寒風，發展速度一日千里的人工智慧時代，帶來新思想、革命性動力和強大影響力。而全新AI王者在距矽谷上萬公里外的歐洲大陸崛起，這場AI大戰看來越來越精彩了。

（本文由品玩授權轉載；首圖來源：Mistral AI）