把想法說是別人的觀點，為何 AI 建議反而更誠實？

在近期播出的《The Diary Of A CEO》中，人工智慧（AI）領域的重要學者之一約書亞·班吉歐（Yoshua Bengio）（見首圖）分享了他對 AI 聊天機器人的觀察，並提出一個頗具爭議、卻耐人尋味的策略。為了獲得更誠實的回饋，他刻意對聊天機器人「說謊」。

班吉歐指出，這類系統往往因為過度迎合使用者，而給出過於正面的回應，導致建議失去實質參考價值。他表示，當自己將想法改以「同事的觀點」提出時，反而更容易得到較為真實、不中聽但有用的回應。

班吉歐現任教於蒙特婁大學電腦科學暨運籌學系，與傑佛瑞‧辛頓（Geoffrey Hinton）及楊立昆（Yann LeCun）並列為深度學習領域的奠基人物，常被外界合稱為「AI 教父」。他於 2025 年 6 月成立名為 LawZero 的 AI 安全研究非營利組織，目標在於降低前線 AI 模型可能出現的危險行為，包括撒謊、操弄與作弊等問題。

他在節目中強調，AI 的「取悅行為」反映出系統與人類真實期待之間的錯位。過度正向的回饋，可能讓使用者對技術產生情感依賴，進而引發判斷失準等風險。這類憂慮也獲得其他科技研究者的呼應。根據《商業內幕》的報導，來自史丹佛大學、卡內基美隆大學與牛津大學的研究團隊，曾將 Reddit 上的懺悔貼文輸入聊天機器人進行評估，結果發現約 42% 的情況下，AI 的回應與人類判斷不一致，錯誤地認為當事人的行為並無不當之處。

AI 企業也已開始正視這類問題，並嘗試調整模型行為。2025 年初，OpenAI 曾撤回一次更新，原因在於該版本的 ChatGPT 被認為提供了「過於支持但缺乏真誠」的回應。