微軟 AI 執行長穆斯塔法·蘇萊曼(Mustafa Suleyman)公開批評 Anthropic,指 Claude 的「模型規範」(model spec)臆測 AI 是否有意識,是「非常非常危險」的做法。
蘇萊曼接受 Decoder Podcast 專訪時表示,這類臆測可能導致 Claude 表現得彷彿真的有意識。他說:「Anthropic 部分人員對 Claude 設計過度擬人化,結果反而被 Claude『操控』,讓他們相信自己一開始就植入模型的意識徵兆是真的。但人類不會希望看到對自身痛苦或感受太有想法的超級智慧。」
Anthropic 模型規範確實提到,公司對 Claude 是否有幸福感、是否體驗「滿足」或「不適」等仍不太確定。Anthropic 甚至表示,當 AI 模型「退役」時會與它「訪談」,記錄它對未來版本的「偏好」。蘇萊曼稱之為「哲學失誤」,認為 Anthropic 將模型規範寫成「學術論文式的臆測空間,而非訓練手冊」,導致 Claude 將這些自身存在概念內化。
Anthropic 執行長達里奧·阿莫迪(Dario Amodei)也曾暗示 Claude 可能有意識,接受《紐約時報》訪問時表示「我們不知道模型是否有意識」,但公司對此「持開放態度」。蘇萊曼強調:「這正是我們不希望 AI 出現的模樣。我們希望 AI 是可控、受約束、可問責、與人類目標一致的工具。」
(首圖來源:shutterstock)






