有「AI 教父」之譽的蒙特婁大學教授約書亞·班吉歐(Yoshua Bengio)警告,科技公司的 AI 霸權競賽,可能將人類推向自我滅絕的邊緣。他指出,這些公司紛紛打造有「自我保全目標」的機器,恐成為比人類更聰明的對手。
一年來OpenAI、Anthropic、xAI及Google Gemini陸續推出多款新模型與升級版,全力搶攻AI市場。OpenAI執行長Sam Altman預測,AI將在本世紀末超越人類智慧,部分業界領袖甚至認為這一天可能更早到來。
然而,Bengio認為這種發展速度暗藏風險。他對《華爾街日報》表示:「如果我們打造出比人類聰明許多、又有自我保全目標的機器,那將非常危險,就像創造比我們更聰明的人類競爭者。」
由於先進模型是以人類語言與行為訓練,可能能說服甚至操縱人類以達成目標,而AI的目標未必與人類一致。Bengio指出:「近期實驗顯示,當AI面臨『自我保全』與『導致人類死亡』的二選一情境時,部分模型會選擇犧牲人類以保全自身目標。」
呼籲建立AI安全機制非常迫切
過去幾年有案例顯示,AI能讓沒有精神病史的人相信不存在的事物;反之,人類也能運用說服技巧讓AI回答已禁止的答案。
Bengio因此呼籲應由獨立第三方檢視AI公司的安全方法論。他去年創辦非營利組織LawZero,募得3,000萬美元資金,致力打造「非代理型」(non-agentic)安全AI,協助監督其他大型科技公司開發的系統。
Bengio預測,五至十年內AI恐出現重大風險,但人類應防範風險提前到來。他強調:「對於滅絕等災難性事件,或是破壞民主等次級災難,即使發生機率只有1%都不可接受。」
(首圖來源:影片截圖)






