根據彭博社報導,中國 AI 新創 DeepSeek 再度加速技術迭代,今日宣布推出 DeepSeek-V3.2 與 V3.2-Speciale 兩款模型。公司指出,新版本在多項推理基準測試中的表現已可與 OpenAI GPT-5 旗艦模型相匹敵,並首次將「思考模式(thinking mode)」與工具使用深度整合,成為其下一代 AI 助理(AI agent)策略的核心布局。
🚀 Launching DeepSeek-V3.2 & DeepSeek-V3.2-Speciale — Reasoning-first models built for agents!
🔹 DeepSeek-V3.2: Official successor to V3.2-Exp. Now live on App, Web & API.
🔹 DeepSeek-V3.2-Speciale: Pushing the boundaries of reasoning capabilities. API-only for now.📄 Tech… pic.twitter.com/SC49UdmCZv
— DeepSeek (@deepseek_ai) December 1, 2025
DeepSeek 表示,V3.2 模型具備類人推理能力,並能自動調用搜尋引擎、計算器與程式碼執行器等工具。這是該公司首次讓模型同時支援「思考」與「非思考」兩種運行模式,並讓推理鏈與工具使用無縫結合。官方技術報告指出,V3.2 在多項 reasoning 基準中,與 Kimi-k2-thinking 與 GPT-5 表現相當。
另一款同步推出的 DeepSeek-V3.2-Speciale 主攻數學運算、長鏈推理與高難度計算任務,其在國際數學奧林匹亞(IMO)與國際資訊奧林匹亞(IOI)等標準化測試上達到金牌水準,並在功能上對標 Google 最新的 Gemini-3 Pro。DeepSeek 強調,Speciale 的目標是「將開源推理能力推到極限,探索模型能力邊界」。
DeepSeek 也透露,其團隊已建立一套全新的 AI agent 訓練方式,使模型能在較少人工介入下與環境互動、分析資訊並自主做決策。就在上一週,DeepSeek 才發布具定理證明能力的 DeepSeekMath-V2,外界視為其推理型模型捷徑的另一重大里程碑。
DeepSeek 在技術報告《DeepSeek-V3.2:Pushing the Frontier of Open Large Language Models》中寫道:「DeepSeek-V3.2 在多項推理 benchmark 上,達到與 GPT-5 和 Kimi-k2-thinking 相似的表現。」
(首圖來源:Unsplash)






