Anthropic 17 日推出 Claude Sonnet 4.6,並設成 Free 及 Pro 方案用戶 claude.ai 與 Claude Cowork 應用程式預設模型。新版寫程式、電腦操控、長文本推理及知識型工作等均有提升,API 定價則與上代 Sonnet 4.5 一樣。
性能突破媲美 Opus
Sonnet 4.6 以 Sonnet 定價提供 Opus 級智慧,是新版最受矚目賣點。過去需要 Opus 系列才能完成的辦公室任務,如分析複雜試算表或填寫多步驟網頁表單,Sonnet 4.6 已達人類操作水準。第三方評測機構 Vals AI 測試顯示 Sonnet 4.6 在 Vals Index 及 Vals Multimodal Index 兩大指標均排名第一。財務代理評測得分 63.3%,稅務評測 v2 得分 77.1%,均超越同期 Opus 4.6。亦在 AIME 數學評測取得 92.3% 高分。

寫程式力大幅提升
Sonnet 4.6 於 SWE-bench 評測取得 76.2% 得分,程式碼除錯範疇較 Sonnet 4.5 提升超過 10 個百分點。Anthropic 表示早期獲試用資格的開發者大多傾向選用 Sonnet 4.6,而非前代甚至 2025 年 11 月的 Claude Opus 4.5,反映市場認可度相當高。新版有 1,000,000 token 上下文視窗,有助處理大型企業檔案及複雜長文本分析任務。
電腦操控達業界新高
Sonnet 4.6 在 Computer Use 功能方面,複雜保險業電腦操控評測取得 94% 高分,是所有 Claude 系列模型最高成績。新版本能主動分析操作失誤並自行修正,大幅提升自主工作流程的可靠性。Anthropic 形容性格溫暖誠實和親社會並偶爾帶幽默感,同時具強安全性,未出現高風險錯位跡象。
Sonnet 4.6 的 API 定價與 Sonnet 4.5 相同。每 1,000,000 input tokens 收費 3 美元,outputtokens 為每 1,000,000 收費 15 美元。Free 方案用戶可直接使用新版預設模型。Pro 方案月費維持 20 美元。Opus 4.6 仍是代理寫程式、自動程式操控及多學科推理的首選,適合定位更高階的專業用戶。Anthropic 近日完成 300 億美元融資,公司估值達 3,800 億美元,較去年 9 月估值增倍。
(本文由 Unwire HK 授權轉載;首圖來源:Anthropic)






