Claude Mythos 攻入美國安局系統傳聞發酵，外媒澄清模擬環境紅隊測試

根據《經濟學人》上週報導指出，Claude Mythos 的強大能力，能在數小時內便成功攻入隸屬於美國國家安全局（National Security Agency，NSA）幾乎所有的機密系統。

Claude Mythos 能力足以攻入 NSA 機密系統的說法，出自於美國參議院情報委員會（Senate Intelligence Committee）副主席 Mark Warner，他表示國家安全局暨網路司令部（U.S. Cyber Command）負責人 Joshua Rudd 將軍曾就該模型的能力向他簡報。

「（這項工具）攻入我們幾乎所有的機密系統，所花的時間不是數週，而是數小時。」根據《經濟學人》6 月 14 日一則報導提及 Joshua Rudd 曾這麼告訴 Mark Warner。

約莫一週後，這段報導內容在多個社群平台傳開，甚至引發 Anthropic 的模型「駭入國安局」的種種議論。對此，報導作者 6 月 21 日發布一份公開聲明，澄清傳聞不實。報導所提及是發生在一次獲得授權的 Anthropic 內部紅隊測試，Claude Mythos 是在高度特定的模擬環境下，搭配其他防禦性工具一同運作。

這則報導似乎也讓美國政府以國家安全為由，日前頒布所有外國人（包括 Anthropic 自家非美國公民的員工）禁止存取 Claude Fable 5 和 Claude Mythos 5 的禁令，這背後的來龍去脈得以浮現。

當時，是美國首次將出口管制直接套用在一款模型上，而非管制驅動模型的硬體設備，美國政府未就禁令提供詳細的公開證據。而模型的安全評估發生在 6 月 11 日，恰巧是 6 月 12 日頒布禁令的前一天。

Anthropic 主張，報導所提及的漏洞屬於一種範圍狹窄的越獄（jailbreak）手法，包括 OpenAI GPT-5.5 在內的競爭對手模型，同樣也能展現出這方面能力。Claude Mythos 標記的行為，實際上不過是要求模型去分析一個程式碼庫並修復模型所找出的問題，點出問題而非 AI 自主發動的攻擊性入侵行動。Anthropic 表示正在努力恢復模型存取，並與美國政府合力準備一套風險管理架構。

社會大眾在 Reddit 論壇討論此事的反應，大致分成三個陣營：占多數的一方將這則報導視為是對政府網路安全的控訴，理由是政府無力聘請到高水準人才，且政府曾有洩密紀錄。第二群則對這則報導抱持懷疑態度，認為它過於聳動，甚至可能是 Anthropic 的行銷噱頭；這群人指出所謂攻入機密系統缺乏相關細節，並質疑國安局負責人的專業技術能力。最後少數一方則對抱持懷疑態度者提出反駁，不應低估 AI 能力的爆發性成長，他們引述網路安全專家的說法，指出 AI 已將攻擊所需時間從數小時壓縮至數分鐘，就連維護良好的開源專案，也面臨大量漏洞浮現的窘境。

儘管爭議尚未落幕，Anthropic 仍在自家提出的 Project Glasswing，持續與國安局密切合作。《金融時報》本月曾報導，約有 6 名 Anthropic 工程師以部署人員身分，直接派駐國安局內部，針對特定的作戰應用對 Claude Mythos 進行調整，知情人士稱這項工作有可能擴展至滲透中國、伊朗等國家所運作的網路。