DeepSeek-V3 模型新版本低調釋出，程式設計和寫作能力提升

DeepSeek 悄悄推出 DeepSeek-V3 模型的新版本 DeepSeek-V3-0324，強調在程式設計和寫作等能力有所提升，並凸顯這家中國 AI 公司力求領先海內外競爭對手的決心。

DeepSeek 根據 MIT 授權條款將 DeepSeek-V3-0324 上傳至開源機器學習社群平台 Hugging Face，開發者能夠自由修改甚至進行商業部署。

DeepSeek 強調 DeepSeek-V3-0324 在幾個關鍵領域比前身 DeepSeek-V3 有顯著的改進，又如 MMLU-Pro、GPQA、AIME、LiveCodeBench 這些基準測試顯著進步。

值得一提的是，DeepSeek-V3-0324 突出之處在於，它能夠在蘋果 Mac Studio 等消費級硬體高效運作，在地端的實際表現令開發者感興趣。

The new Deep Seek V3 0324 in 4-bit runs at > 20 toks/sec on a 512GB M3 Ultra with mlx-lm! pic.twitter.com/wFVrFCxGS6

— Awni Hannun (@awnihannun) March 24, 2025

來自中國的 DeepSeek 以有限資源開發模型產品，取得受人矚目的成績，像是過去 DeepSeek-R1 的基準測試結果可說是追平 OpenAI o1，因此震撼業界，甚至引發美國科技股股價大幅波動，資源相對充足的美國 AI 公司是否能夠繼續捍衛技術優勢和市場地位。

DeepSeek’s New 641GB AI Model Lands Quietly — and Runs Surprisingly Fast on a Mac

（首圖來源：shutterstock）

從這裡可透過《Google 新聞》追蹤 TechNews

科技新知，時時更新

科技新報粉絲團

加入好友

訂閱免費電子報

關鍵字: AI , DeepSeek , 中國 , 人工智慧

想請我們喝幾杯咖啡？

每杯咖啡 65 元

留給我們的話

登入裝置已達上限