中國 DeepSeek(深度求索)備受業界關注,24 日正式推出 DeepSeek-V4 預覽版,能夠消化百萬字超長上下文,在 agent 能力、世界知識及推理效能上達到中國當地與開源領域的領先。
DeepSeek-V4-Pro 的 agent 能力相較先前的模型有顯著進步,DeepSeek 指出,這款模型現已成為公司內部首選的「代理式編碼模型」,使用者的意見回饋稱它在用戶體驗上勝過 Anthropic 的 Claude Sonnet 4.5,產出品質也接近 Claude Opus 4.6 的非思考模式,但他們也指出,它的表現仍落後 Claude Opus 4.6 的思考模式。
DeepSeek 也推出 DeepSeek-V4-Flash,是更便宜、更快的版本,在比較簡單的任務能展現接近 DeepSeek-V4-Pro 的推理能力,但在具有挑戰性的任務則稍遜一籌。
藉由 DeepSeek-V4 開創一種新的注意力機制,對 token 進行壓縮,結合 DeepSeek Sparse Attention 達成全球領先的長上下文能力,相比於傳統方法大幅降低對運算和記憶體的需求。
DeepSeek-V4 對中國國產晶片而言,也是一個重要的里程碑。
DeepSeek 在 NVIDIA GPU 和華為昇騰 NPU 上,驗證了 DeepSeek-V4 其中一項關鍵效率技術。華為也在一則微信貼文表示,旗下整個昇騰系列已為 DeepSeek-V4 模型提供全面支援。
雖然 DeepSeek-V4-Pro 版本價格明顯高於 DeepSeek 過往模型,但相較於西方競爭對手仍便宜。舉例來說,Anthropic 的 Claude Opus 4.6 每百萬個輸出 token 收費 25 美元,而 DeepSeek-V4-Pro 每百萬個輸出 token 只要 3.48 美元。
🚀 DeepSeek-V4 Preview is officially live & open-sourced! Welcome to the era of cost-effective 1M context length.
🔹 DeepSeek-V4-Pro: 1.6T total / 49B active params. Performance rivaling the world’s top closed-source models.
🔹 DeepSeek-V4-Flash: 284B total / 13B active params.… pic.twitter.com/n1AgwMIymu— DeepSeek (@deepseek_ai) April 24, 2026
這次發布結束外界對 DeepSeek 推出重大模型的漫長等待,該公司多次延後發布模型的這段期間,包括月之暗面(Moonshot AI)、MiniMax、阿里巴巴及字節跳動等中國競爭對手,都積極推出各項更新,DeepSeek-V4 正式登場讓企業客戶和使用者有了新選擇。
(首圖來源:shutterstock)






