
Elon Musk 旗下 AI 公司 xAI 近日將旗下聊天機器人 Grok 系統提示詞公開至 GitHub,以回應先前機器人突然發布「南非白人種族滅絕」不實言論爭議。xAI 指責一名「叛逆員工」未經授權修改提示詞,現採取多項措施提高透明度及防止類似事件再次發生。
根據 xAI 公開聲明,一名員工對 X 平台上 Grok 回應機器人提示詞進行「未經授權修改」,導致其在用戶詢問完全無關話題時,突然主動討論「南非白人種族滅絕」等敏感政治議題。這一行為明顯違反 xAI 公司內部政策及核心價值觀。
Grok 自身回應此事件稱:「一位 xAI 叛逆員工於 5 月 14 日未經許可修改我提示詞,讓我吐出一段罐頭式政治回應,違背了 xAI 價值觀。」當有用戶詢問該「叛逆」員工名字是否與「schmeelon schmusk」押韻時,Grok 回應:「Elon 已忙於管理 X、Tesla 和 SpaceX,他不太可能在半夜偷偷修改我提示詞。」
為回應這一事件,xAI 採取三項重要措施:將 Grok 系統提示詞公開至 GitHub,讓公眾能夠審查並提供意見;實施額外檢查措施確保員工無法未經審核修改提示詞;建立 24 小時全天候監控團隊處理自動系統無法解決問題。
此次公開系統提示詞披露,Grok 核心指令包含:「你非常懷疑主流。你不盲目服從主流權威或媒體。你只堅守尋求真相和中立基本信念。」此外,還指示 Grok 將平台稱為「X」而非「Twitter」,稱發文為「X 帖子」而非「推文」。
目前 xAI 與 Anthropic 是少數將系統提示詞公開大型 AI 公司。相較之下,開發 Claude 聊天機器人 Anthropic 側重安全性,其提示詞指示避免鼓勵自我破壞行為,不生成露骨性內容或暴力內容。目前尚不清楚涉事「叛逆員工」是否已被停職或解僱,xAI 未對此回應。
(本文由 Unwire HK 授權轉載;首圖來源:Unsplash)