Anthropic 旗艦模型 Claude Opus 4.6 上線，企業財務分析升級

Anthropic 推出一款面向企業與知識型工作的全新 AI 模型 Claude Opus 4.6，進一步鞏固其在企業軟體領域的優勢。

Claude Opus 4.6 能更謹慎地進行規劃，在代理式 AI（Agentic AI）任務維持更長時間的穩定運作，能在大型程式碼庫更可靠地運行，具備更出色的程式碼審查與除錯能力，能夠抓出並修正自身錯誤。此外，Claude Opus 4.6 在測試階段即提供 100 萬詞元（token）的上下文長度，作為 Claude Opus 系列模型首次嘗試。

在多項評測中，Claude Opus 4.6 展現最先進的性能表現，例如它在代理式程式設計的基準測試 Terminal-Bench 2.0 取得最高分，並在複雜的跨學科推理測試 Humanity’s Last Exam 領先其他模型。在 GDPval-AA 這項評估金融、法律及其他領域具經濟價值的知識型工作表現測試，Claude Opus 4.6 表現比業界次佳模型 OpenAI GPT-5.2 高出約 144 個 Elo 分數，也比前一代 Claude Opus 4.5 高出 190 個 Elo 分數。此外，衡量模型在線上尋找難以取得資訊能力的 BrowseComp 基準測試，Claude Opus 4.6 也優於其他模型。

Anthropic 已對 Claude 在 Excel 中的功能進行重大升級，並以研究預覽形式推出 Claude in PowerPoint，使 Claude 在日常工作情境中的能力大幅提升。

Claude Opus 4.6 已在 Claude.ai、API 以及所有主要的雲端平台上線。若你是開發者，可透過 Claude API 使用 claude-opus-4-6 版本，API 收費維持不變，每百萬個輸入詞元收費 5 美元、每百萬輸出詞元收費 25 美元。