DeepSeek-V3 模型新版本低調釋出,程式設計和寫作能力提升

作者 | 發布日期 2025 年 03 月 25 日 16:09 | 分類 AI 人工智慧 line share Linkedin share follow us in feedly line share
Loading...
DeepSeek-V3 模型新版本低調釋出,程式設計和寫作能力提升

DeepSeek 悄悄推出 DeepSeek-V3 模型的新版本 DeepSeek-V3-0324,強調在程式設計和寫作等能力有所提升,並凸顯這家中國 AI 公司力求領先海內外競爭對手的決心。

DeepSeek 根據 MIT 授權條款將 DeepSeek-V3-0324 上傳至開源機器學習社群平台 Hugging Face,開發者能夠自由修改甚至進行商業部署。

DeepSeek 強調 DeepSeek-V3-0324 在幾個關鍵領域比前身 DeepSeek-V3 有顯著的改進,又如 MMLU-Pro、GPQA、AIME、LiveCodeBench 這些基準測試顯著進步。

值得一提的是,DeepSeek-V3-0324 突出之處在於,它能夠在蘋果 Mac Studio 等消費級硬體高效運作,在地端的實際表現令開發者感興趣。

來自中國的 DeepSeek 以有限資源開發模型產品,取得受人矚目的成績,像是過去 DeepSeek-R1 的基準測試結果可說是追平 OpenAI o1,因此震撼業界,甚至引發美國科技股股價大幅波動,資源相對充足的美國 AI 公司是否能夠繼續捍衛技術優勢和市場地位。

(首圖來源:shutterstock)

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》