Anthropic 推出一款面向企業與知識型工作的全新 AI 模型 Claude Opus 4.6,進一步鞏固其在企業軟體領域的優勢。
Claude Opus 4.6 能更謹慎地進行規劃,在代理式 AI(Agentic AI)任務維持更長時間的穩定運作,能在大型程式碼庫更可靠地運行,具備更出色的程式碼審查與除錯能力,能夠抓出並修正自身錯誤。此外,Claude Opus 4.6 在測試階段即提供 100 萬詞元(token)的上下文長度,作為 Claude Opus 系列模型首次嘗試。
在多項評測中,Claude Opus 4.6 展現最先進的性能表現,例如它在代理式程式設計的基準測試 Terminal-Bench 2.0 取得最高分,並在複雜的跨學科推理測試 Humanity’s Last Exam 領先其他模型。在 GDPval-AA 這項評估金融、法律及其他領域具經濟價值的知識型工作表現測試,Claude Opus 4.6 表現比業界次佳模型 OpenAI GPT-5.2 高出約 144 個 Elo 分數,也比前一代 Claude Opus 4.5 高出 190 個 Elo 分數。此外,衡量模型在線上尋找難以取得資訊能力的 BrowseComp 基準測試,Claude Opus 4.6 也優於其他模型。
Anthropic 已對 Claude 在 Excel 中的功能進行重大升級,並以研究預覽形式推出 Claude in PowerPoint,使 Claude 在日常工作情境中的能力大幅提升。
Claude Opus 4.6 已在 Claude.ai、API 以及所有主要的雲端平台上線。若你是開發者,可透過 Claude API 使用 claude-opus-4-6 版本,API 收費維持不變,每百萬個輸入詞元收費 5 美元、每百萬輸出詞元收費 25 美元。
財務 AI 領域邁步前進
特別的是,Claude Opus 4.6 象徵財務 AI 領域的一大進步,它能夠幫助專業人士以準確的資訊和清晰的分析為基礎做出決策,並產生高品質的成果。這款模型在財務推理、多工處理以及長時間多步驟任務的專注度方面,均顯著優於市場上的其他產品。
Claude Opus 4.6 的財務能力可透過 Cowork 來使用,你可以指定一個桌面資料夾並授權 Claude 讀取。Claude 能夠直接在資料夾中讀取、編輯並建立新檔案。對財務團隊而言,代表你可以同時進行多項分析,並在 Claude 產出各項成果的過程引導思考方式,使其符合你的作業標準。
Claude Opus 4.6 的推出,正值 Anthropic 的 AI 工具推出、並在本週引發軟體股拋售,投資人擔心這些 AI 工具正在顛覆傳統軟體開發,可能衝擊出版、廣告、法律等多種產業。
與此同時,Anthropic 傳與投資人洽談融資約 200 億美元,金額為原先目標的 2 倍,可望推升公司估值達到 3,500 億美元。
(首圖來源:Anthropic)






