Mythos 級 Claude Fable 5 模型釋出,敏感提問改其他模型接手處理

作者 | 發布日期 2026 年 06 月 10 日 11:14 | 分類 AI 人工智慧 , Claude , 資訊安全 line share Linkedin share follow us in feedly line share
Loading...
Mythos 級 Claude Fable 5 模型釋出,敏感提問改其他模型接手處理

Anthropic 首次將其能力最強的模型開放給一般大眾使用,同時也設下相對應的防護機制。

Claude Mythos 今年 4 月以預覽版形式推出,當時因網路安全方面的疑慮,僅提供少數合作夥伴使用。Anthropic 上週擴大合作範圍,新加入橫跨超過 15 個國家、約 150 個跨產業組織。

Anthropic 9 日進一步推出 Claude Mythos 模型首次對外公開的版本──Claude Fable 5,它在軟體工程、知識工作及視覺方面表現出色,同時設有嚴格的安全性限制。在網路安全、生物、化學以及蒸餾(distillation)等高風險領域,它會阻擋相關內容回應,改由 Claude Opus 4.8 接手處理。

與此同時,Anthropic 也向已經獲准使用的合作夥伴推出 Claude Mythos 全新版本 Claude Mythos 5。

對 Claude 使用者而言,並非每一次提問都由 Claude Fable 5 來作答。Anthropic 指出,Claude Fable 5 改由 Claude Opus 4.8 接手處理的情境屬於少數案例。初步數據顯示,至少有 95% 的 Fable 使用階段是完全由這款模型自身回應。

▲ Claude Claude Mythos / Fable 5 基準測試結果。

由於擔心 Claude Mythos 等級的模型如果落入不法分子手中可能帶來嚴重後果,Anthropic 表示推出 Claude Fable 5 之前,透過模擬越獄(jailbreak)行動,對其分類器進行壓力測試。

「在內部,我們進行了一場對外的漏洞獎勵計畫,這項計畫在超過 1,000 小時的測試中,並未產出任何有效的越獄攻擊。我們接著也與多家扮演紅隊角色的資安組織合作,同樣也未找出任何有效的越獄攻擊手法」,Anthropic 表示。

話雖如此,仍有可能出現各式各樣前所未見的攻擊型態。隨著 Claude Fable 5 和 Claude Mythos 5 的推出,Anthropic 將對所有流量資料執行 30 天保留期,即使是先前已經簽下零留存協議的企業客戶也不例外。

Anthropic 表示,這些資料不會用於訓練,而是用於抵禦複雜且前所未見的攻擊行動,包括各種新型越獄手法,並且降低誤報情形。這項政策有可能為整個產業確立先例,模型日益強大,獲得存取權的同時需要留存造訪資料,這被定位成一種安全措施。

Claude Fable 5 可透過 Anthropic 的 Claude API 和採用以量計費的 Enterprise 方案,向任何人開放使用。透過訂閱方式的使用權將分階段推出:即日起至 6 月 22 日為止,這款模型以不額外收費的方式,包括在 Pro、Max、Team 及按席次計費的 Enterprise 方案中;6 月 23 日起,Anthropic 將從上述方案撤下模型,未來使用這款模型需以點數支付。

Claude Fable 5 和 Claude Mythos 5 的定價皆為每百萬個輸入 token 收費 10 美元、每百萬個輸出 token 收費 50 美元,是 Claude Opus 4.8 定價的 2 倍。光是這個定價水準,就有可能阻礙外界廣泛採用,但 Anthropic 仍有信心,預期市場對 Claude Fable 5 需求會相當高,目前難以預估。

(圖片來源:Anthropic

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》