「歐洲版 DeepSeek」Mistral AI 發表新模型,但只跟 DeepSeek 模型比?

作者 | 發布日期 2025 年 12 月 09 日 7:40 | 分類 AI 人工智慧 , 軟體、系統 line share Linkedin share follow us in feedly line share
Loading...
「歐洲版 DeepSeek」Mistral AI 發表新模型,但只跟 DeepSeek 模型比?

號稱「歐洲版 DeepSeek」的 Mistral AI 被 OpenAI、Google 和中國開源模型 DeepSeek、千問夾擊大半年後,終於坐不住了,發表新 Mistral 3 系列模型

Mistral AI 總部位於法國,9 月輝達第三次出手投資後,Mistral 估值達約 135 億美元,成為歐洲 AI 業最受矚目獨角獸之一。

Mistral 居然只盯著中國模型

Mistral 3 公開旗艦模型 Mistral Large 3,以及三款高性價比的小模型 Ministral 3B / 8B / 14B。Mistral Large 3 是主角,總參數量 675B,活躍參數 41B,是 2023 年底至 2024 年初 Mixtral8x7B 和 8x22B 後 Mistral 首個開放權重的混合專家模型。

但官方跑分圖,Mistral 無視 GPT-5.1 或 Gemini 3,看似槍口對準中國 DeepSeek-V3.1 和 Kimi-K2。Mistral 邏輯好像也很直接:參數量只有 Kimi 一半,但性能五五開,甚至更強。

成績單如下:

  • 贏面:MMMLU 和 AMC 的 Mistral Large 3 分別拿到 85.5 和 52.0 高分,略微領先 DeepSeek-V3.1。
  • 輸面:工程師最關心的 LiveCodeBench 和 SimpleQA,Mistral Large 3 還是輸給 Kimi-K2。

比 DeepSeek 笨,還貴三倍?

雖然 Mistral 試圖證明自己是「效率之王」,但 X 有人直接潑冷水,甚至用「Mistral 正在緩慢死亡 」(slow death)形容。他的評價簡單粗暴,列出 Mistral 新模型三大缺點

  1. 更笨:腦子不如 DeepSeek 好。
  2. 更貴:價格卻是 DeepSeek 三倍。
  3. 更慢:推理速度比 GPT-5 還慢。

這確實戳到痛點。Artificial Analysis 最新綜合 AI 指數榜單,Mistral Large 3 得分只有 38 分。前面的有誰?Gemini 3 Pro(73 分)、Claude Opus 4.5(70 分)、GPT-5.1(70 分)。Mistral 離第一梯隊已經不是「追趕」,而是斷層。

LMArena 排行榜,開源非推理模型排第二,總榜第六。成績尚可,但也稱不上「屠榜」。

有測試者發現 Mistral Large 3 各方面表現都不佳

  • 難正確執行工具調用,常會輸出格式錯誤或無效的工具調用指令。
  • 基於圖像的基準測試表現平平。

真正值得衝的,是小模型

Ministral 3 是所有開源模型性價比最高產品,每種參數規模均提供基礎版、指令版和推理版,且都有圖像理解力,全部基於 Apache 2.0 許可證開源。代表用戶能免費商用,隨便魔改。

  • 全能:所有尺寸都支援圖像理解,不再是「瞎子」。
  • 能打:14B 推理版 AIME′25 測試準確率達 85%。

Mistral 3 確實進步,就像網友說的:歐洲仍有一家尖端模型製造商能追上中國開源模型,儘管 Mistral 尚未推出推理器,實際性能仍落後時代。但 DeepSeek 使大模型價格降低的今天,只做到「性能不錯」已不夠,使用者想要 AI 模型不是極致聰明,就是極致便宜。

目前 Mistral 似乎卡在尷尬的中間位置,能否成為「歐洲之光」,可能真得看後續表現了。

(本文由 愛范兒 授權轉載;首圖來源:Mistral AI

延伸閱讀:

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》