Claude Opus 4.8 新模型登場,Mythos 等級模型數週內接力推出

作者 | 發布日期 2026 年 05 月 29 日 11:14 | 分類 AI 人工智慧 , Claude line share Linkedin share follow us in feedly line share
Loading...
Claude Opus 4.8 新模型登場,Mythos 等級模型數週內接力推出

Anthropic 28 日推出新款模型 Claude Opus 4.8,已在所有平台開放使用,收費價格與前一版 Claude Opus 4.7 推出時相同水準。

Claude Opus 4.8 一如預期,帶來堪稱業界領先水準的基準測試表現,同時也特別著重於模型如何處理不良或不確定的資料。Anthropic 在官方部落格文章提到,早期測試人員發現這款模型「更傾向於主動標示工作中的不確定之處,並且比較不會做出沒有依據的論斷」。

參與早期測試的一名橋水(Bridgewater)員工分享心得表示,這次模型升級最大差異在於「Claude Opus 4.8 傾向主動標記分析過程輸入和輸出的問題,這是其他模型通常會忽略、並讓用戶自行去發現的部分。」

▲ Claude Opus 4.8 基準測試表現。

伴隨新模型的發表,Anthropic 同時推出一項名為 Dynamic Workflows 的功能,目前處於研究預覽階段,目的在於協助像 Claude Opus 這類大型模型,管理橫跨數百個平行 subagent 的複雜任務。

「Claude Code 搭配 Claude Opus 4.8,現在能以既有的測試套件作為標準,從專案啟動到合併程式碼,執行涵蓋數十萬行程式碼之程式碼庫規模的整體遷移作業」,Anthropic 在官方部落格文章裡說明。

Claude Opus 4.8 距離前一版 Claude Opus 4.7 發表僅經過 41 天,對 Anthropic 而言,模型升級節奏似乎比過去更快,而目前最新版本的 Claude Sonnet 和 Claude Haiku 分別推出約 3 個月和 7 個月。這次模型迅速迭代,可能與 Claude Opus 4.7 受到用戶冷淡迴響有關,他們對這款模型的表現感到失望。

這段期間適逢 OpenAI Codex 和 Google Gemini Flash 模型的重大更新,帶給 Anthropic 的壓力進一步加重。

繼上個月初步測試 Claude Mythos 預覽版引發網路安全方面的疑慮,Anthropic 目前繼續扣留最先進的 Claude Mythos 模型。不過 Anthropic 暗示,一旦必要的防護機制完成後,Claude Mythos 的預覽階段可能很快將會結束。

「我們在開發這些防護機制方面迅速推進,預期能在未來數週內,將 Claude Mythos 等級的模型提供給我們所有客戶」,Anthropic 表示。

(圖片來源:Anthropic

延伸閱讀:

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》