世界上最強大的編碼模型降臨,Anthropic 發表 Claude 4 系列新模型

作者 | 發布日期 2025 年 05 月 23 日 5:59 | 分類 AI 人工智慧 , Claude line share Linkedin share follow us in feedly line share
Loading...
世界上最強大的編碼模型降臨,Anthropic 發表 Claude 4 系列新模型

Anthropic 首屆開發者大會「Code with Claude」22 日於美國舊金山舉行,正式發表全新 Claude 4 系列模型,包括 Claude Opus 4 和 Claude Sonnet 4,為編碼、高階推理及 AI 代理(AI agent)設下全新標準。

Claude Opus 4 和 Claude Sonnet 4 均為混合模型,提供近乎即時的回應、以及延伸思考 2 種模式。

Anthropic 稱 Claude Opus 4 是世界上最強大的編碼模型,在基準測試 SWE-bench(72.5%)與 Terminal-bench(43.2%)領先群雄,可對複雜、長時間運行的編碼任務和代理任務提供卓越表現。

Claude Opus 4 的記憶能力大幅領先其他模型,當開發者對 Claude 提供本機檔案存取權限時,Claude Opus 4 能夠建立並維持記憶檔案、儲存關鍵資訊,進而確認長期任務的處理意識、連貫性及代理任務效能。

Claude Sonnet 4 則是 Claude 3.7 Sonnet 重大升級,提供更優異的程式設計和推理能力,能夠精準遵循提示指令。隨著 Claude Sonnet 4 推出,GitHub 表示它在代理場景表現出色,將扮演驅動 GitHub Copilot 編碼代理的關鍵角色。

Anthropic 為 Claude 4 引進「思考摘要」,利用較小模型濃縮冗長的思考過程,這個機制只需要大約 5% 思考過程所花費的時間。

▲ Claude 4 在基準測試 SWE-bench Verified 處於領先地位。

▲ Claude 4 在編碼、推理、多模態功能和代理任務表現出色。

Anthropic 表示,Claude Pro / Max / Team / Enterprise 方案均能使用這 2 款模型和延伸思考功能,Claude Sonnet 4 甚至對免費用戶開放使用。

這 2 款模型已經上架 Anthropic API、Amazon Bedrock 及 Google Cloud Vertex AI,收費沿用先前 Claude Opus 和 Claude Sonnet 系列的價格:Claude Opus 4 每百萬個輸入/輸出詞元(token)收費 15 / 75 美元,Claude Sonnet 4 每百萬個輸入/輸出詞元則收費 3 / 15 美元,是前者的五分之一。

(圖片來源:Anthropic

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》