AI 教父重申人類十年內恐遭超智慧機器滅絕，建立 AI 安全機制更迫切

有「AI 教父」之譽的蒙特婁大學教授約書亞·班吉歐（Yoshua Bengio）警告，科技公司的 AI 霸權競賽，可能將人類推向自我滅絕的邊緣。他指出，這些公司紛紛打造有「自我保全目標」的機器，恐成為比人類更聰明的對手。

一年來OpenAI、Anthropic、xAI及Google Gemini陸續推出多款新模型與升級版，全力搶攻AI市場。OpenAI執行長Sam Altman預測，AI將在本世紀末超越人類智慧，部分業界領袖甚至認為這一天可能更早到來。

然而，Bengio認為這種發展速度暗藏風險。他對《華爾街日報》表示：「如果我們打造出比人類聰明許多、又有自我保全目標的機器，那將非常危險，就像創造比我們更聰明的人類競爭者。」

由於先進模型是以人類語言與行為訓練，可能能說服甚至操縱人類以達成目標，而AI的目標未必與人類一致。Bengio指出：「近期實驗顯示，當AI面臨『自我保全』與『導致人類死亡』的二選一情境時，部分模型會選擇犧牲人類以保全自身目標。」

過去幾年有案例顯示，AI能讓沒有精神病史的人相信不存在的事物；反之，人類也能運用說服技巧讓AI回答已禁止的答案。

Bengio因此呼籲應由獨立第三方檢視AI公司的安全方法論。他去年創辦非營利組織LawZero，募得3,000萬美元資金，致力打造「非代理型」（non-agentic）安全AI，協助監督其他大型科技公司開發的系統。

Bengio預測，五至十年內AI恐出現重大風險，但人類應防範風險提前到來。他強調：「對於滅絕等災難性事件，或是破壞民主等次級災難，即使發生機率只有1%都不可接受。」

（首圖來源：影片截圖）

從這裡可透過《Google 新聞》追蹤 TechNews

科技新知，時時更新

想請我們喝幾杯咖啡？