
DeepSeek 悄悄推出 DeepSeek-V3 模型的新版本 DeepSeek-V3-0324,強調在程式設計和寫作等能力有所提升,並凸顯這家中國 AI 公司力求領先海內外競爭對手的決心。
DeepSeek 根據 MIT 授權條款將 DeepSeek-V3-0324 上傳至開源機器學習社群平台 Hugging Face,開發者能夠自由修改甚至進行商業部署。
DeepSeek 強調 DeepSeek-V3-0324 在幾個關鍵領域比前身 DeepSeek-V3 有顯著的改進,又如 MMLU-Pro、GPQA、AIME、LiveCodeBench 這些基準測試顯著進步。
值得一提的是,DeepSeek-V3-0324 突出之處在於,它能夠在蘋果 Mac Studio 等消費級硬體高效運作,在地端的實際表現令開發者感興趣。
The new Deep Seek V3 0324 in 4-bit runs at > 20 toks/sec on a 512GB M3 Ultra with mlx-lm! pic.twitter.com/wFVrFCxGS6
— Awni Hannun (@awnihannun) March 24, 2025
來自中國的 DeepSeek 以有限資源開發模型產品,取得受人矚目的成績,像是過去 DeepSeek-R1 的基準測試結果可說是追平 OpenAI o1,因此震撼業界,甚至引發美國科技股股價大幅波動,資源相對充足的美國 AI 公司是否能夠繼續捍衛技術優勢和市場地位。
(首圖來源:shutterstock)