Claude Opus 4.8 新模型登場，Mythos 等級模型數週內接力推出

Anthropic 28 日推出新款模型 Claude Opus 4.8，已在所有平台開放使用，收費價格與前一版 Claude Opus 4.7 推出時相同水準。

Claude Opus 4.8 一如預期，帶來堪稱業界領先水準的基準測試表現，同時也特別著重於模型如何處理不良或不確定的資料。Anthropic 在官方部落格文章提到，早期測試人員發現這款模型「更傾向於主動標示工作中的不確定之處，並且比較不會做出沒有依據的論斷」。

參與早期測試的一名橋水（Bridgewater）員工分享心得表示，這次模型升級最大差異在於「Claude Opus 4.8 傾向主動標記分析過程輸入和輸出的問題，這是其他模型通常會忽略、並讓用戶自行去發現的部分。」

▲ Claude Opus 4.8 基準測試表現。

伴隨新模型的發表，Anthropic 同時推出一項名為 Dynamic Workflows 的功能，目前處於研究預覽階段，目的在於協助像 Claude Opus 這類大型模型，管理橫跨數百個平行 subagent 的複雜任務。

「Claude Code 搭配 Claude Opus 4.8，現在能以既有的測試套件作為標準，從專案啟動到合併程式碼，執行涵蓋數十萬行程式碼之程式碼庫規模的整體遷移作業」，Anthropic 在官方部落格文章裡說明。

Claude Opus 4.8 距離前一版 Claude Opus 4.7 發表僅經過 41 天，對 Anthropic 而言，模型升級節奏似乎比過去更快，而目前最新版本的 Claude Sonnet 和 Claude Haiku 分別推出約 3 個月和 7 個月。這次模型迅速迭代，可能與 Claude Opus 4.7 受到用戶冷淡迴響有關，他們對這款模型的表現感到失望。

這段期間適逢 OpenAI Codex 和 Google Gemini Flash 模型的重大更新，帶給 Anthropic 的壓力進一步加重。

繼上個月初步測試 Claude Mythos 預覽版引發網路安全方面的疑慮，Anthropic 目前繼續扣留最先進的 Claude Mythos 模型。不過 Anthropic 暗示，一旦必要的防護機制完成後，Claude Mythos 的預覽階段可能很快將會結束。

「我們在開發這些防護機制方面迅速推進，預期能在未來數週內，將 Claude Mythos 等級的模型提供給我們所有客戶」，Anthropic 表示。

（圖片來源：Anthropic）