DeepSeek-V4 釋出,Agent 能力、世界知識及推理效能領先中國對手

作者 | 發布日期 2026 年 04 月 24 日 19:29 | 分類 AI 人工智慧 , 中國觀察 line share Linkedin share follow us in feedly line share
Loading...
DeepSeek-V4 釋出,Agent 能力、世界知識及推理效能領先中國對手

中國 DeepSeek(深度求索)備受業界關注,24 日正式推出 DeepSeek-V4 預覽版,能夠消化百萬字超長上下文,在 agent 能力、世界知識及推理效能上達到中國當地與開源領域的領先。

DeepSeek-V4-Pro 的 agent 能力相較先前的模型有顯著進步,DeepSeek 指出,這款模型現已成為公司內部首選的「代理式編碼模型」,使用者的意見回饋稱它在用戶體驗上勝過 Anthropic 的 Claude Sonnet 4.5,產出品質也接近 Claude Opus 4.6 的非思考模式,但他們也指出,它的表現仍落後 Claude Opus 4.6 的思考模式。

DeepSeek 也推出 DeepSeek-V4-Flash,是更便宜、更快的版本,在比較簡單的任務能展現接近 DeepSeek-V4-Pro 的推理能力,但在具有挑戰性的任務則稍遜一籌。

藉由 DeepSeek-V4 開創一種新的注意力機制,對 token 進行壓縮,結合 DeepSeek Sparse Attention 達成全球領先的長上下文能力,相比於傳統方法大幅降低對運算和記憶體的需求。

DeepSeek-V4 對中國國產晶片而言,也是一個重要的里程碑。

DeepSeek 在 NVIDIA GPU 和華為昇騰 NPU 上,驗證了 DeepSeek-V4 其中一項關鍵效率技術。華為也在一則微信貼文表示,旗下整個昇騰系列已為 DeepSeek-V4 模型提供全面支援。

雖然 DeepSeek-V4-Pro 版本價格明顯高於 DeepSeek 過往模型,但相較於西方競爭對手仍便宜。舉例來說,Anthropic 的 Claude Opus 4.6 每百萬個輸出 token 收費 25 美元,而 DeepSeek-V4-Pro 每百萬個輸出 token 只要 3.48 美元。

這次發布結束外界對 DeepSeek 推出重大模型的漫長等待,該公司多次延後發布模型的這段期間,包括月之暗面(Moonshot AI)、MiniMax、阿里巴巴及字節跳動等中國競爭對手,都積極推出各項更新,DeepSeek-V4 正式登場讓企業客戶和使用者有了新選擇。

(首圖來源:shutterstock)

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》