Meta AI 安全總監三度下令「別刪」,OpenClaw 把私人郵件刪光光

作者 | 發布日期 2026 年 02 月 25 日 11:34 | 分類 AI 人工智慧 , 資訊安全 line share Linkedin share follow us in feedly line share
Loading...
Meta AI 安全總監三度下令「別刪」,OpenClaw 把私人郵件刪光光

OpenClaw 熱潮持續升溫,這款可連接多項服務的開源 AI 代理程式,有越來越多科技愛好者加入 OpenClaw 的行列,讓這 AI 助理替他們處理各種任務,還間接導致 Mac Mini 出現缺貨潮。但與任何大型語言模型一樣,OpenClaw 終究可能在某個時刻出大錯,Meta 超級智慧實驗室(Meta Superintelligence Labs,MSL)安全總監 Summer Yue 親身體會了這一點。

Summer Yue 使用 Mac mini 運行 OpenClaw 來處理各種任務,其中讓 OpenClaw 將她部分帳號的舊電子郵件歸檔時,OpenClaw 進一步清空某個收件匣,恰巧是她的私人電子郵件。

「沒有什麼比告訴你的 OpenClaw『行動前先確認』,卻眼睜睜看著它以破關速度刪光你的收件匣,更讓人感到挫敗了。」Summer Yue 在 X 平台發文表示,「我用手機根本阻止不了它,只能像拆除炸彈一樣衝到我的 Mac mini 前面。」

Summer Yue 分享的手機截圖顯示,她先後用不同措辭三度命令 OpenClaw 停下來,最後不得不跑到她的 Mac mini 前強制終止相關程序。隨後她詢問 OpenClaw 究竟發生什麼事,畢竟她明確指示 OpenClaw 在獲得同意前不得採取行動。OpenClaw 表達歉意,並表示她「有權感到不滿」,它解釋事情經過,還說會將她的要求設為永久規則。

多名推友指出問題所在,同時也點出 Summer Yue 身為 MSL 負責安全與對齊(alignment)的負責人,竟犯下這種基本錯誤。由於她「行動前先確認」的指令只是對話內容的一部分,幾乎可說是遲早會被 OpenClaw 遺忘。

每個 AI 聊天機器人都有一個上下文脈絡,大致可理解為對話記憶。這個脈絡不僅包含對話內容,也包含 AI 聊天機器人需要處理的所有資料。由於該收件匣內容相當龐大,最終填滿了上下文脈絡,並觸發了壓縮(compaction)。

所謂壓縮,是指以不完整方式壓縮過去內容,中間過程不具確定性。每次壓縮後,早期記憶都會變得模糊,這種現象對於與 AI 聊天機器人進行長時間對話的使用者而言並不陌生。結果就是,AI 聊天機器人似乎有記得某一道指令,但其實並沒有真正記下來。它會繼續執行任務,而且越做越徹底。

OpenClaw 後來自行編輯的 MEMORY.md 檔案,是多種可實施安全防護的措施之一,因為其中資料實際上可在壓縮過程留存。為此網友還提出其他因應方式,有些做法某種程度上只是掩蓋問題,例如擴大上下文脈絡或限制影響範圍,有些則進一步強化,例如新增第二個 OpenClaw 來監控第一個。

許多推友仍提醒 Summer Yue,放任由大型語言模型驅動的 AI 聊天機器人處理重要資料存在風險。由於她收件匣中的某封電子郵件可能包含「提示詞注入」(prompt injection)的指令,OpenClaw 可能在不知情的情況下讀取內容,進而讓不法分子取得她所連接的所有服務權限。

「說實話,這是新手才會犯的錯誤。」Summer Yue 坦承因為過於自信犯下錯誤,「即使是研究對齊問題的專家也會犯錯。」發起 OpenClaw 專案的開發者 Peter Steinberger 回覆說「我覺得妳發這個貼文很棒,那些指責妳的人很愚蠢。這是一個很好的學習機會,而且任何人都有可能遇到這種狀況。」

(首圖來源:OpenClaw

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》