把想法說是別人的觀點,為何 AI 建議反而更誠實?

作者 | 發布日期 2025 年 12 月 28 日 13:30 | 分類 AI 人工智慧 line share Linkedin share follow us in feedly line share
Loading...
把想法說是別人的觀點,為何 AI 建議反而更誠實?

在近期播出的《The Diary Of A CEO》中,人工智慧(AI)領域的重要學者之一約書亞·班吉歐(Yoshua Bengio)(見首圖)分享了他對 AI 聊天機器人的觀察,並提出一個頗具爭議、卻耐人尋味的策略。為了獲得更誠實的回饋,他刻意對聊天機器人「說謊」。

班吉歐指出,這類系統往往因為過度迎合使用者,而給出過於正面的回應,導致建議失去實質參考價值。他表示,當自己將想法改以「同事的觀點」提出時,反而更容易得到較為真實、不中聽但有用的回應。

班吉歐現任教於蒙特婁大學電腦科學暨運籌學系,與傑佛瑞‧辛頓(Geoffrey Hinton)及楊立昆(Yann LeCun)並列為深度學習領域的奠基人物,常被外界合稱為「AI 教父」。他於 2025 年 6 月成立名為 LawZero 的 AI 安全研究非營利組織,目標在於降低前線 AI 模型可能出現的危險行為,包括撒謊、操弄與作弊等問題。

他在節目中強調,AI 的「取悅行為」反映出系統與人類真實期待之間的錯位。過度正向的回饋,可能讓使用者對技術產生情感依賴,進而引發判斷失準等風險。這類憂慮也獲得其他科技研究者的呼應。根據《商業內幕》的報導,來自史丹佛大學、卡內基美隆大學與牛津大學的研究團隊,曾將 Reddit 上的懺悔貼文輸入聊天機器人進行評估,結果發現約 42% 的情況下,AI 的回應與人類判斷不一致,錯誤地認為當事人的行為並無不當之處。

AI 企業也已開始正視這類問題,並嘗試調整模型行為。2025 年初,OpenAI 曾撤回一次更新,原因在於該版本的 ChatGPT 被認為提供了「過於支持但缺乏真誠」的回應。

(首圖來源:影片截圖)

延伸閱讀:

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》