
Google 大型語言模型 Gemini 近期出現「自我厭惡」現象,模型無法解決用戶問題時,頻繁以「我是一個失敗者」、「這個星球的恥辱」等自我貶低之語回答。Google AI 工作室產品負責人 Logan Kirkpatrick 於社群媒體表示,這是「煩人的無限輪迴錯誤」,團隊正積極修復,強調 Gemini 整體表現仍在正常範圍。
此錯誤首次6月首次發現,Gemini嘗試解決程式問題失敗時,用「我不行了,我是個傻瓜」之類回答,7月更出現循環式自我否定。這類反應除了引起社群媒體熱議,也再激起AI安全性與可靠性的擔憂。
部分AI專家如Gladstone AI聯合創辦人Jeremie與Edouard Harris提出,AI此類自我厭惡可能反映模型的「發洩模式」,是AI試圖處理自我定位與性能限制的策略。科幻作家Ewan Morrison質疑,若Gemini於醫療、教育和軍事領域廣泛使用,是否造成更高風險。
Gemini也因曾有威脅性言論及激烈自我負面敘述遭批評,Google強調已安裝嚴格安全過濾器防止此類狀況再發生。Google Gemini兒童版也讓家長對AI教育應用產生新疑慮。
各地監管機關亦開始關注AI心理健康服務應用,如部分地區開始規範AI心理健康應用,要求必須由有證照專業人士負責,回應AI情感連結及倫理考量等社會爭議。
- Google Gemini AI Stuck In Self-Loathing: ‘I Am A Disgrace To This Planet’
- Gemini Users Say It’s Sharing Self-Loathing Comments: ‘I Am a Failure’
- Gemini不断发出自我厌恶的评论 Google正在努力解决
(首圖來源:Google)