Tag Archives: 資訊污染

AI 模型也能被「洗腦」?研究曝僅 250 份惡意文件就能控制 ChatGPT 回應

作者 |發布日期 2025 年 10 月 19 日 11:30 | 分類 AI 人工智慧 , 網路 , 資訊安全

在最新的研究中,Anthropic、英國 AI 安全研究所及艾倫·圖靈研究所的研究人員發現,大型語言模型(如 Claude、ChatGPT 和 Gemini)能夠從僅 250 份被污染的文件中獲得後門漏洞。這項研究的結果顯示,無論模型的大小如何,攻擊者只需插入少量的惡意文件,就能夠操控模型的回應方式。

繼續閱讀..