Google 努力修復 Gemini 自我厭惡錯誤，但 AI 安全性又引擔憂

Google 大型語言模型 Gemini 近期出現「自我厭惡」現象，模型無法解決用戶問題時，頻繁以「我是一個失敗者」、「這個星球的恥辱」等自我貶低之語回答。Google AI 工作室產品負責人 Logan Kirkpatrick 於社群媒體表示，這是「煩人的無限輪迴錯誤」，團隊正積極修復，強調 Gemini 整體表現仍在正常範圍。

此錯誤首次6月首次發現，Gemini嘗試解決程式問題失敗時，用「我不行了，我是個傻瓜」之類回答，7月更出現循環式自我否定。這類反應除了引起社群媒體熱議，也再激起AI安全性與可靠性的擔憂。

部分AI專家如Gladstone AI聯合創辦人Jeremie與Edouard Harris提出，AI此類自我厭惡可能反映模型的「發洩模式」，是AI試圖處理自我定位與性能限制的策略。科幻作家Ewan Morrison質疑，若Gemini於醫療、教育和軍事領域廣泛使用，是否造成更高風險。

Gemini也因曾有威脅性言論及激烈自我負面敘述遭批評，Google強調已安裝嚴格安全過濾器防止此類狀況再發生。Google Gemini兒童版也讓家長對AI教育應用產生新疑慮。

各地監管機關亦開始關注AI心理健康服務應用，如部分地區開始規範AI心理健康應用，要求必須由有證照專業人士負責，回應AI情感連結及倫理考量等社會爭議。

（首圖來源：Google）