贏了世界冠軍不意外，和 AI 在 DOTA 中並肩作戰才讓人糾結又興奮

台灣時間 4 月 14 日凌晨 2 點半（美國西岸時間 4 月 13 日早上 11 點半），OpenAI 的 DOTA 2 AI「OpenAI Five」為我們帶來最後一場公開表演賽。比賽結果自然不難猜測，不過除結果外也有更多有趣的東西。

▲ OpenAI CTO Greg Brockman 和 OG 戰隊 5 位成員的合影。

「OpenAI Five」首先對陣 2018 年 DOTA2 世界邀請賽（Ti 8）冠軍 OG 戰隊，三局兩勝以 2：0 完勝 OG 戰隊。接下來，OpenAI 安排了人機合作比賽，雙方都是兩名人類選手和 3 個 AI──這比賽非常耐人尋味，我們猜測人類選手和 AI（如果有思維）都會在心裡想：我這幾個隊友是怎麼回事、怎麼老是和我節奏不一樣、這比賽讓人怎麼玩？最後，OpenAI 宣布，DOTA2 AI 將對全世界 DOTA2 玩家免費開放，下週起就可體驗。

表演賽 Part 1：「OpenAI Five」vs. OG 戰隊

去年 7、8 月的表演賽，「OpenAI Five」就曾在 5v5 比賽擊敗人類高階玩家乃至（前）職業選手。雖然 AI 沒能贏所有場次比賽，但 AI 的各種亮眼操作（以及 AI 讓人摸不著頭腦的隨地插眼法）仍給大家留下深刻的印象。比賽告一段落後，OpenAI CTO Greg Brockman 繼續在 Twitter 更新「OpenAI Five」的最近進展，甚至表示最新版已能以高勝率擊敗公開展示過的幾個版本了。這樣一來，繼續優化到今天，尤其是 Greg Brockman 表示，「OpenAI Five」遊戲中的訓練時間相當於 4 萬 5 千年那麼長，今天比賽完勝人類職業戰隊的世界冠軍 OG 戰隊，也不令人意外了。

需要說明的是，目前最新的「OpenAI Five」仍然使用和 Ti8 表演賽一樣的規則：一共 18 個英雄供雙方選擇，不允許使用聖劍和魔瓶、不允許使用召喚物和幻象。我們似乎更有理由相信 AI 在這樣的設定下獲勝是合理的：在這個複雜度降低的設定中，AI 經過夠長時間訓練，已可逼近某個最優解了──相比之下，人類職業選手肯定不習慣這設定，僅英雄選擇方面就大大限制了人類選手的發揮。

另外，去年表演賽結束後結合 OpenAI 公開的資料分析過「OpenAI Five」的設計方式，結合今天「OpenAI Five」的表現來看，很有可能維持同樣模式，最大的改進在於更多訓練時間。

第一局中，OG 陣容選出的陣容是小牛、巫醫、隱刺、毒龍、影魔，「OpenAI Five」為冰女，死亡先知、火槍、矮人直升機、流浪劍客。一選時「OpenAI Five」預估的自己的勝率為 65.1%，全部選擇完畢後還繼續上升到 67.6%。

比賽一開始 AI 方就在天輝上路賞金符處拿到一血，然後在公螢幕打字「我們預期贏得這場比賽的勝率超過 80%」（就和去年表演賽一樣）。AI 方的線上進攻依舊主動兇狠，即便 OG 有小牛在各路積極遊走和保護，且 AI 方也沒有針對隱刺買眼買粉而讓他占了不少便宜，雙方在前十幾分鐘仍打得勢均力敵。隨著比賽進行，AI 方的經濟和擊殺數逐漸建立起優勢，最終 38 分鐘時夜魘方基地被攻破，AI 方與 OG 的人頭比為 52：29。

第二局比賽 OG 陣容為火槍、小牛、死亡先知、小魚人、惡魔巫師，「OpenAI Five」陣容為冰女、矮人直升機、流浪劍客、巫醫、毒龍。這次「OpenAI Five」選人完畢時的預測勝率只有 60%，但 OG 在對線期就打出很大劣勢，最終這局比賽 14 分鐘上高地，20 分鐘就以 45：6 人頭比結束了。這點想起來很有趣：「OpenAI Five」認為這次開局時自己的優勢不如上一局大，但是針對自己操作這樣陣容的情況做的判斷，顯然沒有預料到人類的表現和自己大不同。

AI 也繼續展現亮眼的團戰操作。比如下面動圖，第一局比賽 OG 小牛和隱刺繞後冰女，結果在 AI 的火槍配合下隱刺和巫醫雙雙被反殺，OG 的影魔也葬身之後最終才帶走了冰女。

第二局，AI 的冰女利用暗影護符和地形卡視野黑血秀 OG 的矮人狙擊手，並成功反殺。

AI 當然也繼續表現出秒沉默之類的快速反應，但其實除了這些，更令人意外的是「OpenAI Five」的比賽風格。比如所有英雄都會正常發展自己的經濟，冰女甚至幾分鐘時就會自己打野，可說這和中國 DOTA 戰隊常見的「四保一」打法形成鮮明對比，在前中期團戰時發揮了不小威力；等級低時 AI 的英雄經常死亡後立即買活，簡直像人類玩家在賭氣。

兩局比賽結束後，OpenAI 還透露，準備表演賽的過程中 OpenAI 還邀請了 3 支一線 DOTA2 戰隊嘗試挑戰 AI，全都以 2：0 敗給「OpenAI Five」。OG 戰隊今天的表現，對 OpenAI 來說可說是完全在預料之中了。

表演賽 Part 2：人類和「OpenAI Five」並肩作戰

不知道大家是否記得，2017 年 5 月 AlphaGo Master 在中國烏鎮對局柯潔時，同一峰會也安排了人類棋手和 AlphaGo 的配對賽，古力和連笑兩位棋手分別和 AlphaGo 組成小組，雙方對局人類和 AlphaGo 輪流落子。兩位棋手賽後都表示 AlphaGo 和自己的思路、風格不一樣，經常下出讓自己意外的棋──類似的事自然也在此次「OpenAI Five」表演賽出現。

人機合作比賽雙方都是兩名人類選手和 3 個 AI，4 位人類選手都是遊戲解說，所以當作表演賽，他們就像直播，一邊比賽一邊對所有觀眾說出自己的想法。解說們這種邊玩邊吐槽、也邊玩邊期待 AI 和自己配合的過程中，大家對 AI 都有很多全新的感受：

最根本的，其實 AI 並不知道隊友有一些不是 AI，它仍然會視隊友都和自己一樣的 AI 去處理，也許 AI 也會覺得不適應？但反過來，即便人類控制的英雄已出現很多低級錯誤，我們相信 AI 仍可像相信 AI 隊友那樣相信他。
對出擊策略的把握有很大區別，人類選手在河道吃了隱身符準備對對方中路英雄發動攻擊時，自己中路的 AI 卻逕自去了邊路；人類選手表示很鬱悶。
人類無法捉摸 AI 的步調，不知道 AI 是否認為己方是優勢、是否應該主動攻擊。那麼理想情況下人類應該如何和 AI 溝通？肯定不會總是聽人類的，也不會總讓 AI 帶領節奏。實際上 AI 有時候會直接打字告訴人類自己的決定（比如自己要打 1 號位），但對人類發的訊息就不怎麼反應（簡直像是人機互動的負面案例）。

和以前一樣，AI 的插眼方式很奇怪──這可能是相比去年的版本，唯一沒有顯著提升的地方，完全可猜到這是因為訓練插眼時用的回饋仍是「要留空格子」。Blitz 甚至直接問「上路到底發生什麼了，為什麼地上插了 4 個眼？？？」另一方的人類選手 Sheever 說：「我們的 AI 總把眼插在奇怪的地方，但我想插都買不了，一直在冷卻。」（後來 AI 在這裡又插了一個眼，一共 5 個）。
AI 對某些英雄的理解和人類完全不同。比如 AI 認為死亡先知在 10~20 分鐘的時間段內是非常強的英雄，它會非常積極地使用技能、參與團戰。但人類就會認為這時候的死亡先知並不厲害。
有觀戰者根據 AI 的表現猜測影響 AI 戰場決策最重要的因素是站位和技能冷卻；同時 AI 也確實會考慮隊友的位置。也所以，人機合作比賽的節奏要明顯慢於 5 人都是 AI 的狀況──兩個人類隊友的位置和其他 3 個 AI 的節奏不一致，集體進攻也就沒那麼積極果斷了。
AI 在樹叢裡找人的技術好像不怎麼樣，當然這件事學起來也比較難。另外人類也很難在和 AI 對局時練習，人類在逃命時會有一些「下意識」的操作，但很難說 AI 的處理方式是出於什麼原因。
人類選手 Blitz 比賽中說：「不管我走哪路，去了以後都感覺自己好像走錯路了。從這個角度來說，和 AI 一起玩挺難受的。但是如果我去哪的時候 AI 也一起來了，那我就感覺挺好的。彷彿一邊打遊戲一邊解謎。」

表演賽 Part 3：人人都可以挑戰「OpenAI Five」

賽前的開場演講，Greg Brockman 說要透過「OpenAI Five」展示 AI 有高能力水準、高可拓展性，以及可增強人類的能力。前面 Part 1 的人機對戰和 Part 2 的合作對戰中，算是展現出高能力及一部分「增強人類的能力」，那麼在 Part 3，我們終於看到「高可拓展性」意味著什麼：每個人都可以和 OpenAI 的 DOTA2 AI 對戰，可以是對手，也可以是隊友，下週開始，在 arena.openai.com 註冊即可體驗！

表演賽結束後的討論，有人提到阻礙「OpenAI Five」這種高水準競技 AI 大規模普及的最大障礙之一，顯然是它需要的訓練時間太長，Greg Brockman 也在 Twitter 回應，解決這個問題會是他們的下一個目標。顯然根據這次表演賽，除了深度學習技術方面繼續鑽研，人類和 AI 如何有效溝通、並肩合作，已是浮出水面的問題。我們期待 OpenAI 未來也在這方面帶來一些驚喜。

（本文由雷鋒網授權轉載；首圖來源：OpenAI）