AI 戰勝電競選手後，美國想用玩家腦波訓練軍事機器人

如同前陣子美軍使用無人機對伊朗行使斬首行動，證明現代戰爭即將進入自動時代，美國在軍事技術和思想一直走在世界最前端。

日前，稱為網路發源地的美國 DARPA（國防高等研究計劃署）開始了關於 AI 在軍事決策領域的研究。

從外媒報導，可得知紐約大學水牛城分校人工智慧學院工程師已獲得 DARPA 資助。他們透過創造類似《星海爭霸》或《恆星戰役》（Stellaris）等遊戲，並採集玩家的大腦活動和反應，使用這些資料訓練 AI 。

▲ DeepMind 決策過程。

與 AlphaGo 下圍棋不同，類似《星海爭霸》的 RTS 遊戲在策略和操作複雜度更高，需要玩家協調採集資源、建造建築、選擇進攻策略，甚至還要操控每個士兵的精細動作，且都是在有「戰爭迷霧」，也就是不完全資訊的條件下進行。

▲ 水牛城分校研究現場。（Source：水牛城分校）

很顯然，此類遊戲比簡單的棋類策略與真實的戰場環境更接近，在這種資訊不對稱的環境訓練的 AI，更容易在資訊錯綜複雜的戰場上做合理判斷。

可能有人要問，這和之前 Google 團隊針對《星海爭霸 II》開發的 DeepMind 有什麼區別。與 DeepMind 目的是獲勝不同，DARPA 想觀察人類在類似場景的判斷和決策，並用機器學習演算法整理，訓練出能相互協調的機器人。

▲ DeepMind 眼中的遊戲。

為了達成目的，DARPA 要求所有在水牛城分校玩新策略遊戲的玩家配戴偵測腦波圖（EEG）的頭盔。觀察玩家做決策時，研究者可對照腦波圖，觀察玩家在策略選擇時的大腦活動。

同時研究人員還搭配特殊的超高速鏡頭追蹤玩家的眼球運動。配合遊戲畫面，觀察人類在決策時的直覺反應。

對於 DARPA 來說，他們並不想要單單執行工作的機器人，他們需要一群機器人互相配合，根據目前掌握的資訊自己規劃、並有策略的完成工作。

如果策略執行時遇到阻礙，也能隨機應變。比如高度複雜的環境下（天氣、地理環境、敵我動態）多達 250 個單位（空中與地面機器人）協作，這時突然出現煙霧導致可見度低落，AI 控制的機器人同樣能改變策略，完成工作。

▲ 未來的無人機蜂群作戰。

只有達到這種程度，AI 在軍事領域的應用才能派上用場。

但從目前來看，目前 AI 都是在相對確定的環境下訓練，但真實環境往往複雜且缺乏資訊。在這種環境下決策，AI 需要根據已知資訊推理，目前 AI 在這方面還處於新生兒狀態。

▲ 美軍微型無人機「蜂群」展示。（Source：影片截圖）

此研究的意義是讓人類成為老師，向 AI 展現人類長期演化後的直覺，並透過監測腦波，向 AI 展示人類如何處理接收的資訊，進而讓 AI 產生推理能力，並最終學會如何制定總體策略。

▲ 完成工作後「蜂群」繞圈飛行。（Source：影片截圖）

我們知道，人類之所以能生存下來，就是因為人類不僅有個體決策，還有指導人類完成工作的總體策略。所以如果想要 AI 完成人類的工作，指導 AI 相互配合並制定總體決策就勢在必行。

過去，機器是輔助人類工作的工具，必須由人操控。後來，人類為工具編好執行流程，讓工具按照流程自動工作。

現在，機器透過機器學習和神經網路演算法，能執行簡單的判斷和決策工作。

未來，人類將賦予機器群體策略能力，人類不再需要為每個機器決定工作，我們只需要給一個目標，AI 就會制定整體策略，並分配工作給獨立 AI 操控的每台機器，合作完成任務。

從總體來看，這是人類的一大技術進步。只是從歷史角度看，這種技術通常先用在軍事行動。還是那句老話：技術不分善惡，只在用途。如果這種技術成為現實，希望永遠不要用於戰爭。

（本文由愛范兒授權轉載；首圖來源：水牛城分校）

想請我們喝幾杯咖啡？