Tag Archives: 推理型 AI

推理型 AI「思考過程」有欺騙行為?Anthropic 發現風險

作者 |發布日期 2025 年 04 月 10 日 16:28 | 分類 AI 人工智慧 , 資訊安全 , 軟體、系統

推理型 AI 模型日漸普及,這類大型語言模型(LLM)回答用戶查詢時會展示思考過程,即所謂的思維鏈(Chain-of-Thought,CoT),使用戶有種 AI 有透明度的錯覺,似乎能跟隨並理解模型如何決策。然 Anthropic 最近以一系列精心設計實驗,測試 CoT 模型推理的「誠實度」,顯示 AI 還是有欺騙成分。

繼續閱讀..