綜合港媒報導,DeepSeek 推出新型數學推理模型 DeepSeekMath-V2,採用可自我驗證的訓練框架。該模型在 2025 年國際數學奧林匹克競賽(IMO 2025)和 2024 年中國數學奧林匹克競賽(CMO 2024)中均達到金牌水準,並在 2024 年普特南數學競賽(Putnam 2024)中獲得近乎滿分的 118 / 120 分優異成績。
據悉,該模型基於DeepSeek-V3.2-Exp-Base建構,透過LLM驗證器自動審查生成的數學證明,並利用高難度樣本持續優化性能,透過驗證、產生閉環和元驗證機制,顯著提升證明品質評估準確性,並實現全自動化標註。
該團隊表示,儘管尚有大量工作待推進,當前成果已表明,可自驗證的數學推理是一條切實可行的研究路徑,有望為建構更強大、更可靠的數學智慧系統奠定基礎。此外,模型代碼與權重已開源,發布於Hugging Face及GitHub平台。






