還有得打!OpenAI Five 出戰《Dota 2》TI8 表演賽,人類扳回一城

作者 | 發布日期 2018 年 09 月 02 日 23:35 | 分類 AI 人工智慧 , 電子娛樂 , 電競 follow us in feedly

過去一年間,OpenAI 在《Dota 2》遊戲已接連打敗了一般玩家和半職業戰隊,但在 8 月 22 日《Dota 2》的 The International 8(TI8)年度賽事,全新的「OpenAI Five」隊伍卻接連輸給職業戰隊,結束今年度的 TI8 旅程,看來要取代人類主宰電子遊戲,AI 或許還有很長一段路要走。



據了解,這次 TI8 為 OpenAI Five 舉辦了兩場表演賽,分別對上巴西知名戰隊 paiN Gaming 及中國元老玩家組成的隊伍 Big God,由於先前的輝煌戰績,許多人都看好 OpenAI Five 能與職業隊伍一較高下,但最終 OpenAI Five 卻兩場賽事都輸給了人類。

談論這次比賽以前,我們不妨先來了解一下 OpenAI Five 與《Dota 2》遊戲究竟是什麼。

OpenAI Five 是 5 個人工神經網路組成的團隊,是非營利 AI 研究機構 OpenAI 專門為學習 Dota 2 所設計。就像人類玩家,這些神經網路也是從對 Dota 一無所知開始學習,它們將 Dota 世界視為 2 萬個數字列表,並透過可見數字來理解遊戲現狀(為求公平,AI 也僅限解讀人類玩家可看到的訊息)。

與人類玩家不同的是,OpenAI Five 必須傳送 8 個數字列表來選擇動作,設計者編寫的代碼只是使其在遊戲狀態、操作和數字列表間對照,經過訓練後,這些神經網路雖擁有記憶,但也不會在遊戲中進一步學習,同時儘管身為一個「團隊」,神經網路之間並沒有特殊的溝通橋梁,只有開發者提供的獎賞來激勵。

至於《Dota 2》,是一款典型的多人線上戰鬥競技(MOBA)遊戲,在一般遊戲情況下,兩隻隊伍會各有五名隊員,目標都是摧毀敵人基地內的「遺跡」,雙方隊伍經常會在地圖爭取優勢的過程中發生零星戰鬥,一局的遊戲時間約在 40 分鐘。

說起電子遊戲與 AI 對戰,許多人可能會認為理所當然會由 AI 獲勝,但其實 MOBA 是相當需要團隊合作的遊戲,這兩次比賽的結果似乎也顯示這種情況。兩場人機大戰中,比賽分別持續 51 分鐘和 45 分鐘,OpenAI Five 在遊戲初期都一度領先,不論金錢或人頭都有更好的表現,然而戰略層面則展示了一些奇怪的行為,像是在 Roshan(註)的巢穴外一直不走,讓對手趁機在地圖其他地區取得優勢,或是在一些奇怪的時間點選擇施放強大法術。

註:Roshan 是需要團隊合作才能打敗的強大生物,擊殺 Roshan 能獲得優勢,反之會損失資源。

遊戲中明顯可看出,人類玩家在一些需要計算的地方不如 AI,但相反的戰略部分,AI 也比不上人類玩家,這似乎反應出 AI 與人類在學習遊玩 Dota 2 的差異──儘管我們計算理所當然比不上電腦,但即時思考的靈活度人類還是略勝一籌。

OpenAI 技術人員 Filip Wolski 告訴 The Register,相較先前的比賽,他們對於贏得這場比賽更沒自信,因為職業選手畢竟是更艱難的挑戰。「輸掉比賽令人失望,但我很高興能與頂級戰隊相互拉扯這麼長時間。」

當然必須一提的是,雙方此次對戰都有一些讓步,舉例來說,AI 目前可掌握遊玩的英雄只有 18 人,為了節省時間並確保平衡,雙方團隊的角色都已由主辦方和 OpenAI 預選,同時也減少遊戲一些變數,而 AI 代理的反應時間也從 0.08 秒增加到 0.2 秒,為人類玩家提供機會。

隨著 OpenAI 持續研究,未來雙方應該能在更公平的情況下較量,屆時究竟誰能勝出,也就更引人期待。

(首圖來源:達志影像)

延伸閱讀:

關鍵字: , ,