DeepSeek-R1 模型升級新版本,推理能力接近 o3、Gemini 2.5 Pro

作者 | 發布日期 2025 年 05 月 30 日 7:44 | 分類 AI 人工智慧 line share Linkedin share follow us in feedly line share
Loading...
DeepSeek-R1 模型升級新版本,推理能力接近 o3、Gemini 2.5 Pro

中國 DeepSeek(深度求索)釋出 DeepSeek-R1-0528 模型新版本,使其免費開源模型在推理能力能與 OpenAI o3、Google Gemini 2.5 Pro 等付費專有模型並駕齊驅。

DeepSeek-R1-0528 以 2024 年 12 月發表的 DeepSeek-V3-Base 為基礎,在後訓練(Post-Training)過程投入更多算力,提升新版模型思考深度與推理能力,有助於提升數學、科學、商業及程式設計等複雜推理任務上的表現。

DeepSeek-R1-0528 在數學、程式設計及通用邏輯等多個基準測試取得優異成績,並在整體表現上接近如 OpenAI o3、Google Gemini 2.5 Pro。

相較於舊版 DeepSeek-R1,新版模型在複雜推理任務的表現有所提升。例如 AIME 2025 測試,因推理過程中加強思考深度,新版模型準確率由舊版的 70% 提升至 87.5%。

同時,DeepSeek 蒸餾 DeepSeek-R1-0528 的 CoT(Chain of Thought)後訓練 Qwen3-8B Base,得到了 DeepSeek-R1-0528-Qwen3-8B。這款 8B 模型在數學測驗 AIME 2024 僅次於 DeepSeek-R1-0528、超越 Qwen3-8B,並與 Qwen3-235B 相當。DeepSeek 認為,DeepSeek-R1-0528 的 CoT 對於學術界推理模型的研究和工業界針對小模型的發展皆具意義。

▲ DeepSeek 釋出 DeepSeek-R1-0528 新版本。

與先前版本相同,DeepSeek-R1-0528 採用 MIT 授權條款,並上傳至開源機器學習社群平台 Hugging Face,開發者能夠自由修改甚至進行商業部署。

(首圖來源:shutterstock)

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》