Grok 答不出〈柏德之門 3〉問題,馬斯克怒凍模型更新、抽調工程師緊急救火

作者 | 發布日期 2026 年 02 月 27 日 13:30 | 分類 AI 人工智慧 , Grok , 遊戲軟體 line share Linkedin share follow us in feedly line share
Loading...
Grok 答不出〈柏德之門 3〉問題,馬斯克怒凍模型更新、抽調工程師緊急救火

伊隆‧馬斯克(Elon Musk)旗下 AI 公司 xAI 去年曾因聊天機器人 Grok 無法準確回答〈柏德之門〉(Baldur’s Gate)遊戲細節問題,延遲數天推出模型更新。xAI 更緊急抽調多名高級工程師放下手頭項目,專門協助改善 Grok 遊戲知識庫。

工程師臨時被抽調  遊戲問題觸發內部混亂

Business Insider 深度調查報導披露,Elon Musk 對 Grok 回答〈柏德之門 3〉(Baldur’s Gate 3)細節問題表現強烈不滿,下令延遲推出相關模型更新。他要求高級工程師放下手頭項目,轉而處理遊戲知識不足問題。部分前 xAI 員工形容公司工作氛圍猶如無休止消防演習 。xAI 位於帕羅奧圖(Palo Alto)總部設有多個作戰室,隨時應對各種緊急情況 。Elon Musk 對遊戲知識執著程度不只於此。他同時要求工程師提升 Grok 在〈英雄聯盟〉(League of Legends)遊戲能力,目標更是達到最高挑戰者(Challenger)段位。

Larian Studios 開發〈柏德之門 3〉,以龍與地下城(Dungeons & Dragons)為背景。遊戲劇情複雜且機制豐富,廣受 RPG 玩家好評。由於網路上有大量相關攻略可供參考,業界對 Grok 當時連這款遊戲細節問題也答錯感到相當意外。

Grok 成績大翻身  準確率現達 92%

事發後 Grok 於〈柏德之門 3〉相關知識表現明顯改善。TechCrunch 於 2026 年 2 月報導,Grok 現時已能準確回答〈柏德之門〉相關問題。有測試機構以 BaldurBench 為名,向 Grok、ChatGPT、Claude 及 Gemini 各提出 5 條〈柏德之門〉相關問題進行比較。結果顯示 Grok 整體勝任,準確率據報達 92%。

四大 AI 風格各異

測試結果顯示各 AI 回答遊戲問題時風格截然不同。Grok 偏好以表格形式呈現資料,並大量使用 save-scumming 及 DPS 等玩家術語,不熟悉遊戲用戶較難理解。ChatGPT 傾向以重點列表簡潔作答 。Gemini 著重以粗體標示關鍵詞。Claude 則對劇透極為謹慎,建議玩家自行探索遊戲。由於各 AI 大多從相同網上攻略資源汲取知識,回答風格差異比內容差異更為明顯。

這次事件突顯 xAI 內部管理混亂。這同時反映 Elon Musk 對 Grok 能力有極高要求,最終讓 Grok 遊戲知識領域能力得到大幅提升。

(本文由 Unwire HK 授權轉載;首圖來源:Unsplash

 

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》