DeepSeek-V4 釋出，Agent 能力、世界知識及推理效能領先中國對手

中國 DeepSeek（深度求索）備受業界關注，24 日正式推出 DeepSeek-V4 預覽版，能夠消化百萬字超長上下文，在 agent 能力、世界知識及推理效能上達到中國當地與開源領域的領先。

DeepSeek-V4-Pro 的 agent 能力相較先前的模型有顯著進步，DeepSeek 指出，這款模型現已成為公司內部首選的「代理式編碼模型」，使用者的意見回饋稱它在用戶體驗上勝過 Anthropic 的 Claude Sonnet 4.5，產出品質也接近 Claude Opus 4.6 的非思考模式，但他們也指出，它的表現仍落後 Claude Opus 4.6 的思考模式。

DeepSeek 也推出 DeepSeek-V4-Flash，是更便宜、更快的版本，在比較簡單的任務能展現接近 DeepSeek-V4-Pro 的推理能力，但在具有挑戰性的任務則稍遜一籌。

藉由 DeepSeek-V4 開創一種新的注意力機制，對 token 進行壓縮，結合 DeepSeek Sparse Attention 達成全球領先的長上下文能力，相比於傳統方法大幅降低對運算和記憶體的需求。

DeepSeek-V4 對中國國產晶片而言，也是一個重要的里程碑。

DeepSeek 在 NVIDIA GPU 和華為昇騰 NPU 上，驗證了 DeepSeek-V4 其中一項關鍵效率技術。華為也在一則微信貼文表示，旗下整個昇騰系列已為 DeepSeek-V4 模型提供全面支援。

雖然 DeepSeek-V4-Pro 版本價格明顯高於 DeepSeek 過往模型，但相較於西方競爭對手仍便宜。舉例來說，Anthropic 的 Claude Opus 4.6 每百萬個輸出 token 收費 25 美元，而 DeepSeek-V4-Pro 每百萬個輸出 token 只要 3.48 美元。

🚀 DeepSeek-V4 Preview is officially live & open-sourced! Welcome to the era of cost-effective 1M context length.

🔹 DeepSeek-V4-Pro: 1.6T total / 49B active params. Performance rivaling the world’s top closed-source models.
🔹 DeepSeek-V4-Flash: 284B total / 13B active params.… pic.twitter.com/n1AgwMIymu

— DeepSeek (@deepseek_ai) April 24, 2026