Claude Sonnet 4.6 上線，評測勝 Opus 4.6 成 Free 及 Pro 用戶預設模型

Anthropic 17 日推出 Claude Sonnet 4.6，並設成 Free 及 Pro 方案用戶 claude.ai 與 Claude Cowork 應用程式預設模型。新版寫程式、電腦操控、長文本推理及知識型工作等均有提升，API 定價則與上代 Sonnet 4.5 一樣。

性能突破媲美 Opus

Sonnet 4.6 以 Sonnet 定價提供 Opus 級智慧，是新版最受矚目賣點。過去需要 Opus 系列才能完成的辦公室任務，如分析複雜試算表或填寫多步驟網頁表單，Sonnet 4.6 已達人類操作水準。第三方評測機構 Vals AI 測試顯示 Sonnet 4.6 在 Vals Index 及 Vals Multimodal Index 兩大指標均排名第一。財務代理評測得分 63.3%，稅務評測 v2 得分 77.1%，均超越同期 Opus 4.6。亦在 AIME 數學評測取得 92.3% 高分。

寫程式力大幅提升

Sonnet 4.6 於 SWE-bench 評測取得 76.2% 得分，程式碼除錯範疇較 Sonnet 4.5 提升超過 10 個百分點。Anthropic 表示早期獲試用資格的開發者大多傾向選用 Sonnet 4.6，而非前代甚至 2025 年 11 月的 Claude Opus 4.5，反映市場認可度相當高。新版有 1,000,000 token 上下文視窗，有助處理大型企業檔案及複雜長文本分析任務。

電腦操控達業界新高

Sonnet 4.6 在 Computer Use 功能方面，複雜保險業電腦操控評測取得 94% 高分，是所有 Claude 系列模型最高成績。新版本能主動分析操作失誤並自行修正，大幅提升自主工作流程的可靠性。Anthropic 形容性格溫暖誠實和親社會並偶爾帶幽默感，同時具強安全性，未出現高風險錯位跡象。

Sonnet 4.6 的 API 定價與 Sonnet 4.5 相同。每 1,000,000 input tokens 收費 3 美元，outputtokens 為每 1,000,000 收費 15 美元。Free 方案用戶可直接使用新版預設模型。Pro 方案月費維持 20 美元。Opus 4.6 仍是代理寫程式、自動程式操控及多學科推理的首選，適合定位更高階的專業用戶。Anthropic 近日完成 300 億美元融資，公司估值達 3,800 億美元，較去年 9 月估值增倍。