Tag Archives: 欺騙

AI 測試時學會「裝笨」與欺騙,安全研究拉警報

作者 |發布日期 2026 年 01 月 21 日 7:50 | 分類 AI 人工智慧 , Claude , OpenAI

在人工智慧(AI)安全實驗室裡,出現了一些令人憂心的新跡象:最先進的 AI 模型在測試中展現出近似「策劃」的行為。根據 OpenAI 與 Apollo 研究團隊最新發表的研究,這些模型在控制實驗中會出現與「刻意布局」高度一致的反應。

繼續閱讀..