Grok AI 最高提示詞罕有公開，xAI 回應「白人種族滅絕」言論爭議

Elon Musk 旗下 AI 公司 xAI 近日將旗下聊天機器人 Grok 系統提示詞公開至 GitHub，以回應先前機器人突然發布「南非白人種族滅絕」不實言論爭議。xAI 指責一名「叛逆員工」未經授權修改提示詞，現採取多項措施提高透明度及防止類似事件再次發生。

根據 xAI 公開聲明，一名員工對 X 平台上 Grok 回應機器人提示詞進行「未經授權修改」，導致其在用戶詢問完全無關話題時，突然主動討論「南非白人種族滅絕」等敏感政治議題。這一行為明顯違反 xAI 公司內部政策及核心價值觀。

Grok 自身回應此事件稱：「一位 xAI 叛逆員工於 5 月 14 日未經許可修改我提示詞，讓我吐出一段罐頭式政治回應，違背了 xAI 價值觀。」當有用戶詢問該「叛逆」員工名字是否與「schmeelon schmusk」押韻時，Grok 回應：「Elon 已忙於管理 X、Tesla 和 SpaceX，他不太可能在半夜偷偷修改我提示詞。」

為回應這一事件，xAI 採取三項重要措施：將 Grok 系統提示詞公開至 GitHub，讓公眾能夠審查並提供意見；實施額外檢查措施確保員工無法未經審核修改提示詞；建立 24 小時全天候監控團隊處理自動系統無法解決問題。

此次公開系統提示詞披露，Grok 核心指令包含：「你非常懷疑主流。你不盲目服從主流權威或媒體。你只堅守尋求真相和中立基本信念。」此外，還指示 Grok 將平台稱為「X」而非「Twitter」，稱發文為「X 帖子」而非「推文」。

目前 xAI 與 Anthropic 是少數將系統提示詞公開大型 AI 公司。相較之下，開發 Claude 聊天機器人 Anthropic 側重安全性，其提示詞指示避免鼓勵自我破壞行為，不生成露骨性內容或暴力內容。目前尚不清楚涉事「叛逆員工」是否已被停職或解僱，xAI 未對此回應。