贏了世界冠軍不意外,和 AI 在 DOTA 中並肩作戰才讓人糾結又興奮

作者 | 發布日期 2019 年 04 月 16 日 8:15 | 分類 AI 人工智慧 , 科技趣聞 , 遊戲軟體 follow us in feedly


台灣時間 4 月 14 日凌晨 2 點半(美國西岸時間 4 月 13 日早上 11 點半),OpenAI 的 DOTA 2 AI「OpenAI Five」為我們帶來最後一場公開表演賽。比賽結果自然不難猜測,不過除結果外也有更多有趣的東西。

▲ OpenAI CTO Greg Brockman 和 OG 戰隊 5 位成員的合影。

「OpenAI Five」首先對陣 2018 年 DOTA2 世界邀請賽(Ti 8)冠軍 OG 戰隊,三局兩勝以 2:0 完勝 OG 戰隊。接下來,OpenAI 安排了人機合作比賽,雙方都是兩名人類選手和 3 個 AI──這比賽非常耐人尋味,我們猜測人類選手和 AI(如果有思維)都會在心裡想:我這幾個隊友是怎麼回事、怎麼老是和我節奏不一樣、這比賽讓人怎麼玩?最後,OpenAI 宣布,DOTA2 AI 將對全世界 DOTA2 玩家免費開放,下週起就可體驗。

表演賽 Part 1:「OpenAI Five」vs. OG 戰隊

去年 7、8 月的表演賽,「OpenAI Five」就曾在 5v5 比賽擊敗人類高階玩家乃至(前)職業選手。雖然 AI 沒能贏所有場次比賽,但 AI 的各種亮眼操作(以及 AI 讓人摸不著頭腦的隨地插眼法)仍給大家留下深刻的印象。比賽告一段落後,OpenAI CTO Greg Brockman 繼續在 Twitter 更新「OpenAI Five」的最近進展,甚至表示最新版已能以高勝率擊敗公開展示過的幾個版本了。這樣一來,繼續優化到今天,尤其是 Greg Brockman 表示,「OpenAI Five」遊戲中的訓練時間相當於 4 萬 5 千年那麼長,今天比賽完勝人類職業戰隊的世界冠軍 OG 戰隊,也不令人意外了。

需要說明的是,目前最新的「OpenAI Five」仍然使用和 Ti8 表演賽一樣的規則:一共 18 個英雄供雙方選擇,不允許使用聖劍和魔瓶、不允許使用召喚物和幻象。我們似乎更有理由相信 AI 在這樣的設定下獲勝是合理的:在這個複雜度降低的設定中,AI 經過夠長時間訓練,已可逼近某個最優解了──相比之下,人類職業選手肯定不習慣這設定,僅英雄選擇方面就大大限制了人類選手的發揮。

另外,去年表演賽結束後結合 OpenAI 公開的資料分析過「OpenAI Five」的設計方式,結合今天「OpenAI Five」的表現來看,很有可能維持同樣模式,最大的改進在於更多訓練時間。

第一局中,OG 陣容選出的陣容是小牛、巫醫、隱刺、毒龍、影魔,「OpenAI Five」為冰女,死亡先知、火槍、矮人直升機、流浪劍客。一選時「OpenAI Five」預估的自己的勝率為 65.1%,全部選擇完畢後還繼續上升到 67.6%。

比賽一開始 AI 方就在天輝上路賞金符處拿到一血,然後在公螢幕打字「我們預期贏得這場比賽的勝率超過 80%」(就和去年表演賽一樣)。AI 方的線上進攻依舊主動兇狠,即便 OG 有小牛在各路積極遊走和保護,且 AI 方也沒有針對隱刺買眼買粉而讓他占了不少便宜,雙方在前十幾分鐘仍打得勢均力敵。隨著比賽進行,AI 方的經濟和擊殺數逐漸建立起優勢,最終 38 分鐘時夜魘方基地被攻破,AI 方與 OG 的人頭比為 52:29。

第二局比賽 OG 陣容為火槍、小牛、死亡先知、小魚人、惡魔巫師,「OpenAI Five」陣容為冰女、矮人直升機、流浪劍客、巫醫、毒龍。這次「OpenAI Five」選人完畢時的預測勝率只有 60%,但 OG 在對線期就打出很大劣勢,最終這局比賽 14 分鐘上高地,20 分鐘就以 45:6 人頭比結束了。這點想起來很有趣:「OpenAI Five」認為這次開局時自己的優勢不如上一局大,但是針對自己操作這樣陣容的情況做的判斷,顯然沒有預料到人類的表現和自己大不同。

AI 也繼續展現亮眼的團戰操作。比如下面動圖,第一局比賽 OG 小牛和隱刺繞後冰女,結果在 AI 的火槍配合下隱刺和巫醫雙雙被反殺,OG 的影魔也葬身之後最終才帶走了冰女。

第二局,AI 的冰女利用暗影護符和地形卡視野黑血秀 OG 的矮人狙擊手,並成功反殺。

AI 當然也繼續表現出秒沉默之類的快速反應,但其實除了這些,更令人意外的是「OpenAI Five」的比賽風格。比如所有英雄都會正常發展自己的經濟,冰女甚至幾分鐘時就會自己打野,可說這和中國 DOTA 戰隊常見的「四保一」打法形成鮮明對比,在前中期團戰時發揮了不小威力;等級低時 AI 的英雄經常死亡後立即買活,簡直像人類玩家在賭氣。

兩局比賽結束後,OpenAI 還透露,準備表演賽的過程中 OpenAI 還邀請了 3 支一線 DOTA2 戰隊嘗試挑戰 AI,全都以 2:0 敗給「OpenAI Five」。OG 戰隊今天的表現,對 OpenAI 來說可說是完全在預料之中了。

表演賽 Part 2:人類和「OpenAI Five」並肩作戰

不知道大家是否記得,2017 年 5 月 AlphaGo Master 在中國烏鎮對局柯潔時,同一峰會也安排了人類棋手和 AlphaGo 的配對賽,古力和連笑兩位棋手分別和 AlphaGo 組成小組,雙方對局人類和 AlphaGo 輪流落子。兩位棋手賽後都表示 AlphaGo 和自己的思路、風格不一樣,經常下出讓自己意外的棋──類似的事自然也在此次「OpenAI Five」表演賽出現。

人機合作比賽雙方都是兩名人類選手和 3 個 AI,4 位人類選手都是遊戲解說,所以當作表演賽,他們就像直播,一邊比賽一邊對所有觀眾說出自己的想法。解說們這種邊玩邊吐槽、也邊玩邊期待 AI 和自己配合的過程中,大家對 AI 都有很多全新的感受:

  • 最根本的,其實 AI 並不知道隊友有一些不是 AI,它仍然會視隊友都和自己一樣的 AI 去處理,也許 AI 也會覺得不適應?但反過來,即便人類控制的英雄已出現很多低級錯誤,我們相信 AI 仍可像相信 AI 隊友那樣相信他。
  • 對出擊策略的把握有很大區別,人類選手在河道吃了隱身符準備對對方中路英雄發動攻擊時, 自己中路的 AI 卻逕自去了邊路;人類選手表示很鬱悶。
  • 人類無法捉摸 AI 的步調,不知道 AI 是否認為己方是優勢、是否應該主動攻擊。那麼理想情況下人類應該如何和 AI 溝通?肯定不會總是聽人類的,也不會總讓 AI 帶領節奏。實際上 AI 有時候會直接打字告訴人類自己的決定(比如自己要打 1 號位),但對人類發的訊息就不怎麼反應(簡直像是人機互動的負面案例)。
  • 和以前一樣,AI 的插眼方式很奇怪──這可能是相比去年的版本,唯一沒有顯著提升的地方,完全可猜到這是因為訓練插眼時用的回饋仍是「要留空格子」。Blitz 甚至直接問「上路到底發生什麼了,為什麼地上插了 4 個眼???」另一方的人類選手 Sheever 說:「我們的 AI 總把眼插在奇怪的地方,但我想插都買不了,一直在冷卻。」(後來 AI 在這裡又插了一個眼,一共 5 個)。
  • AI 對某些英雄的理解和人類完全不同。比如 AI 認為死亡先知在 10~20 分鐘的時間段內是非常強的英雄,它會非常積極地使用技能、參與團戰。但人類就會認為這時候的死亡先知並不厲害。
  • 有觀戰者根據 AI 的表現猜測影響 AI 戰場決策最重要的因素是站位和技能冷卻;同時 AI 也確實會考慮隊友的位置。也所以,人機合作比賽的節奏要明顯慢於 5 人都是 AI 的狀況──兩個人類隊友的位置和其他 3 個 AI 的節奏不一致,集體進攻也就沒那麼積極果斷了。
  • AI 在樹叢裡找人的技術好像不​​怎麼樣,當然這件事學起來也比較難。另外人類也很難在和 AI 對局時練習,人類在逃命時會有一些「下意識」的操作,但很難說 AI 的處理方式是出於什麼原因。
  • 人類選手 Blitz 比賽中說:「不管我走哪路,去了以後都感覺自己好像走錯路了。從這個角度來說,和 AI 一起玩挺難受的。但是如果我去哪的時候 AI 也一起來了,那我就感覺挺好的。彷彿一邊打遊戲一邊解謎。」

表演賽 Part 3:人人都可以挑戰「OpenAI Five」

賽前的開場演講,Greg Brockman 說要透過「OpenAI Five」展示 AI 有高能力水準、高可拓展性,以及可增強人類的能力。前面 Part 1 的人機對戰和 Part 2 的合作對戰中,算是展現出高能力及一部分「增強人類的能力」,那麼在 Part 3,我們終於看到「高可拓展性」意味著什麼:每個人都可以和 OpenAI 的 DOTA2 AI 對戰,可以是對手,也可以是隊友,下週開始,在 arena.openai.com 註冊即可體驗!

表演賽結束後的討論,有人提到阻礙「OpenAI Five」這種高水準競技 AI 大規模普及的最大障礙之一,顯然是它需要的訓練時間太長,Greg Brockman 也在 Twitter 回應,解決這個問題會是他們的下一個目標。顯然根據這次表演賽,除了深度學習技術方面繼續鑽研,人類和 AI 如何有效溝通、並肩合作,已是浮出水面的問題。我們期待 OpenAI 未來也在這方面帶來一些驚喜。

(本文由 雷鋒網 授權轉載;首圖來源:OpenAI

延伸閱讀:

關鍵字: , , ,