DeepSeek 推可自驗證數學模型 DeepSeekMath-V2

綜合港媒報導，DeepSeek 推出新型數學推理模型 DeepSeekMath-V2，採用可自我驗證的訓練框架。該模型在 2025 年國際數學奧林匹克競賽（IMO 2025）和 2024 年中國數學奧林匹克競賽（CMO 2024）中均達到金牌水準，並在 2024 年普特南數學競賽（Putnam 2024）中獲得近乎滿分的 118 / 120 分優異成績。

據悉，該模型基於DeepSeek-V3.2-Exp-Base建構，透過LLM驗證器自動審查生成的數學證明，並利用高難度樣本持續優化性能，透過驗證、產生閉環和元驗證機制，顯著提升證明品質評估準確性，並實現全自動化標註。

該團隊表示，儘管尚有大量工作待推進，當前成果已表明，可自驗證的數學推理是一條切實可行的研究路徑，有望為建構更強大、更可靠的數學智慧系統奠定基礎。此外，模型代碼與權重已開源，發布於Hugging Face及GitHub平台。

（本文由 MoneyDJ新聞授權轉載；首圖來源：DeepSeek）