Anthropic 28 日推出新款模型 Claude Opus 4.8,已在所有平台開放使用,收費價格與前一版 Claude Opus 4.7 推出時相同水準。
Claude Opus 4.8 一如預期,帶來堪稱業界領先水準的基準測試表現,同時也特別著重於模型如何處理不良或不確定的資料。Anthropic 在官方部落格文章提到,早期測試人員發現這款模型「更傾向於主動標示工作中的不確定之處,並且比較不會做出沒有依據的論斷」。
參與早期測試的一名橋水(Bridgewater)員工分享心得表示,這次模型升級最大差異在於「Claude Opus 4.8 傾向主動標記分析過程輸入和輸出的問題,這是其他模型通常會忽略、並讓用戶自行去發現的部分。」

▲ Claude Opus 4.8 基準測試表現。
伴隨新模型的發表,Anthropic 同時推出一項名為 Dynamic Workflows 的功能,目前處於研究預覽階段,目的在於協助像 Claude Opus 這類大型模型,管理橫跨數百個平行 subagent 的複雜任務。
「Claude Code 搭配 Claude Opus 4.8,現在能以既有的測試套件作為標準,從專案啟動到合併程式碼,執行涵蓋數十萬行程式碼之程式碼庫規模的整體遷移作業」,Anthropic 在官方部落格文章裡說明。
Claude Opus 4.8 距離前一版 Claude Opus 4.7 發表僅經過 41 天,對 Anthropic 而言,模型升級節奏似乎比過去更快,而目前最新版本的 Claude Sonnet 和 Claude Haiku 分別推出約 3 個月和 7 個月。這次模型迅速迭代,可能與 Claude Opus 4.7 受到用戶冷淡迴響有關,他們對這款模型的表現感到失望。
這段期間適逢 OpenAI Codex 和 Google Gemini Flash 模型的重大更新,帶給 Anthropic 的壓力進一步加重。
繼上個月初步測試 Claude Mythos 預覽版引發網路安全方面的疑慮,Anthropic 目前繼續扣留最先進的 Claude Mythos 模型。不過 Anthropic 暗示,一旦必要的防護機制完成後,Claude Mythos 的預覽階段可能很快將會結束。
「我們在開發這些防護機制方面迅速推進,預期能在未來數週內,將 Claude Mythos 等級的模型提供給我們所有客戶」,Anthropic 表示。
- Anthropic Launches Opus 4.8 AI Model With Improved Coding Capabilities
- Anthropic releases Opus 4.8 with new ‘dynamic workflow’ tool
- Claude’s new model is more ‘honest’ when it messes up
(圖片來源:Anthropic)






