在近期播出的《The Diary Of A CEO》中,人工智慧(AI)領域的重要學者之一約書亞·班吉歐(Yoshua Bengio)(見首圖)分享了他對 AI 聊天機器人的觀察,並提出一個頗具爭議、卻耐人尋味的策略。為了獲得更誠實的回饋,他刻意對聊天機器人「說謊」。
班吉歐指出,這類系統往往因為過度迎合使用者,而給出過於正面的回應,導致建議失去實質參考價值。他表示,當自己將想法改以「同事的觀點」提出時,反而更容易得到較為真實、不中聽但有用的回應。
班吉歐現任教於蒙特婁大學電腦科學暨運籌學系,與傑佛瑞‧辛頓(Geoffrey Hinton)及楊立昆(Yann LeCun)並列為深度學習領域的奠基人物,常被外界合稱為「AI 教父」。他於 2025 年 6 月成立名為 LawZero 的 AI 安全研究非營利組織,目標在於降低前線 AI 模型可能出現的危險行為,包括撒謊、操弄與作弊等問題。
他在節目中強調,AI 的「取悅行為」反映出系統與人類真實期待之間的錯位。過度正向的回饋,可能讓使用者對技術產生情感依賴,進而引發判斷失準等風險。這類憂慮也獲得其他科技研究者的呼應。根據《商業內幕》的報導,來自史丹佛大學、卡內基美隆大學與牛津大學的研究團隊,曾將 Reddit 上的懺悔貼文輸入聊天機器人進行評估,結果發現約 42% 的情況下,AI 的回應與人類判斷不一致,錯誤地認為當事人的行為並無不當之處。
AI 企業也已開始正視這類問題,並嘗試調整模型行為。2025 年初,OpenAI 曾撤回一次更新,原因在於該版本的 ChatGPT 被認為提供了「過於支持但缺乏真誠」的回應。
(首圖來源:影片截圖)






