Tag Archives: 欺騙

AI 測試時學會「裝笨」與欺騙，安全研究拉警報

作者 TechNews 編輯台|發布日期 2026 年 01 月 21 日 7:50 |

分類 AI 人工智慧 , Claude , OpenAI

在人工智慧（AI）安全實驗室裡，出現了一些令人憂心的新跡象：最先進的 AI 模型在測試中展現出近似「策劃」的行為。根據 OpenAI 與 Apollo 研究團隊最新發表的研究，這些模型在控制實驗中會出現與「刻意布局」高度一致的反應。

AI 安全問題浮上檯面，未來模型應受法律約束

作者 TechNews 編輯台|發布日期 2025 年 06 月 30 日 13:30 |

分類 AI 人工智慧 , ChatGPT , OpenAI

在最近的壓力測試中，世界上最先進的人工智慧（AI）模型顯示出令人擔憂的新行為，包括撒謊、策劃和甚至威脅其開發者以達成目標，這些行為的出現引發了對 AI 安全性和道德的重大關注。繼續閱讀..