南韓棋手用來作弊的開源 AI 工具 Leela Zero,連柯潔都說有點厲害

作者 | 發布日期 2020 年 07 月 22 日 8:15 | 分類 AI 人工智慧 , Google , 科技趣聞 line share follow us in feedly line share
南韓棋手用來作弊的開源 AI 工具 Leela Zero,連柯潔都說有點厲害


自 4 年前 AlphaGo 首次登場以來,AI 第一次以作弊工具的身分出現在圍棋賽場上。

南韓棋手用 AI 作弊被判刑

據外媒消息,近日,南韓地方法院受理了一起圍棋錦標賽 AI 作弊案件,相關涉事人員被判處有期徒刑 1 年。

今年 1 月 14 日,在南韓圍棋定段賽上,一位棋手的異樣行為引起了裁判注意,隨後檢查發現,這名選手身上藏了無線耳機、微型相機等多個違規電子產品。

原來棋手正透過這些電子產品與外界同夥溝通,試圖利用 AI 作弊。其衣服扣子上的微型相機即時拍攝棋局,負責接收的同夥利用 AI 技術分析棋盤局勢,並將反饋結果傳遞到棋手的無線耳機中。

據了解,棋手所使用的 AI 技術正是由比利時程式設計師 Gian-Carlo Pascutto(GCP)開發的 AI 計畫 Leela Zero,它是圍棋領域為數不多的開源計畫之一,所有人在 Github 上都可以下載使用。

由於裁判發現及時,棋手及同夥的作弊行為並未成功。不過,南韓棋院認為兩人行為影響惡劣,觸犯了業務妨礙罪,交由警察處理後,還委託律師擬定起訴書,對兩人提起刑事訴訟。

近日,南韓東部地方法院做出最終判決:嫌疑人 A 以職業定段為目的,與同夥 B 經過周密計劃,利用智慧技術違規比賽規則,嚴重破壞了比賽的公平、公正,非常惡劣。經認定,判處嫌疑人 A 一年有期徒刑,其同夥 B 一年有期徒刑,緩期一年執行,並提供 120 小時社會服務。

至此,這場令人不齒的作弊事件算是以應有的懲罰收尾。不過,在事件的背後,有網友感嘆,現在隨便一個 AI 都可以戰勝職業選手了嗎?還有網友調侃,人工智慧已經開始奴役人類了!

談到 AI 在圍棋中擊敗人類,大部分人可能首先想到的都是 Google 出品的 AlphaGo。2016 年,AlphaGo 以 4:1 戰勝世界頂級職業選手李世乭。2017 年,AlphaGo Master 再次以 3:0 戰勝中國圍棋甲級聯賽主將柯潔。

事實上,在此之後,AI 在圍棋領域的技術研發從未間斷,經過 4 年的發展,能夠戰勝人類世界冠軍水平的 AI,也已經遠不只 AlphaGo 一個。

作弊工具 Leela Zero 戰績頗豐

熟悉圍棋的朋友可能了解,Leela Zero 並不是一個名不見經傳的 AI 棋手。它曾在第 32、38、42 屆 KGS 電腦圍棋大賽多次奪冠,在 2008 年電腦奧林匹克賽上獲得九路圍棋銀牌和十九路圍棋銅牌。

Leela Zero 是 GCP 根據 Google 最強開源計畫 Alpha Zero 擴展而來。如同 Alpha Zero 的發展路徑,它不藉助任何人類知識,完全從零開始訓練。同時,它採用分布式計算,透過他人電腦生成的自對弈棋譜傳送到伺服器上進行訓練,以此藉助全球志願者的力量為 Leela Zero 提供算力支援。

據了解,Leela Zero 的棋力正是透過神經網路權重的不斷更迭而提升的(權重:表徵神經網路內部聯繫的一系列參數)。當伺服器對棋譜進行訓練後,會產生新的網路權重,新的權重會與之前的最強權重對局,用以檢驗棋力,如果它在 400 局中勝率超過 55% 就會被更新為當前的最強權重。

(Source:Github

現在每天有近 600 人為 Leela Zero 提供訓練棋譜,在最近半年時間內,Leela Zero 已經自我對弈 700 萬局,經歷 128 次權重更迭。

另外,Leela-Zero 憑藉出色的棋力已經成為了人類最佳圍棋陪練師。它非常規性的打法、出其不意的布局,常常能夠帶給人類突破性的啟發。因此很多圍棋愛好者喜歡透過與它博弈或者復盤訓練來提升自己的棋力。

一名微博網友還分享了他看 Leela-Zero 自戰局的感受,特別賞心悅目。

中國棋士柯潔也發文表示:Leela Zero 的訓練厲害了,我是不是也要賺錢買一台超級電腦來跑 AI,現在學程式設計還來得及嗎?

Leela Zero 計畫從 2017 年就在 Github 開源了,目前已經獲得了 4.2k 星標。連結內含詳細下載安裝流程,按提示操作完成後,就可以與 AI 棋手線上博弈了。

AI 碾壓人類,輕輕鬆鬆

如柯潔所說現在的 AI 棋手已經非常多,而且能夠打敗世界級職業選手的也不在少數。如中國經典棋手騰訊絕藝。

在 2019 年,絕藝第 4 次奪得了「世界智慧圍棋公開賽冠軍」。它是騰訊 AI Lab 自研的一款圍棋 AI。從 2016 年發布首個版本到現在,已經在各大賽事中,先後戰勝過柯潔、古力、朴廷桓等一百多位職業棋手。

不過,值得一提的是,這位 AI 圍棋常勝將軍卻在 2018 年的世界人工智慧圍棋大賽中,敗給了自家兄弟「PhoenixGo」。

PhoenixGo,俗稱「金毛」(因比賽時的頭像而得名),是微信翻譯團隊研發人工智慧圍棋程式。在這場世界級 AI 圍棋大賽中,PhoenixGo 一舉奪冠,戰勝了來自中、日、韓、歐美等國家和地區的一流 AI 圍棋高手。如 LeelaZero、TSGo、DolBaram(石子旋風)、Golois,HEROZ Kishi、Baduki 等。

說到國內比較出色的 AI 棋手,還有一位不得不提,它就是「星陣圍棋」。在 2018 年,「貝瑞基因杯」世界人工智慧圍棋大賽人機大戰中,星陣圍棋執黑 145 手戰勝柯潔,之後,在「讓先三十番棋」挑戰賽中,輪番對戰職業選手時越、江維傑、崔哲瀚、元晟溱、周俊勳等世界冠軍,最終以 40:1 的戰績奪冠,勝率達到 97.6%。

更重要的是,星陣圍棋是一款中國產 AI。其他 AI 棋手大部分都是師從 Google 論文,星陣是獨創了自己的研發程式,而且它的對戰策略也與 Google 明顯不同。

Google 演算法更偏向勝率,為保持大局經常會選擇暫時退讓,而星陣的策略是強勢進攻,把人類按在地上,能前進絕不退讓。

據了解,星際圍棋的前身是清華大學的「神算子」,之後經過深客科技完成後續的技術升級。該公司董事長金涬博士,在大數據、深度學習、人工智慧領域深耕多年,是人工智慧在圍棋產業應用的重要推動者。

而歷數國外的圍棋 AI,除了 Google 的 Alpha 系列外,最出色的可能就是 Facebook 出品的 ELF OpenGo 了。這款 AI 圍棋項計畫也於 2018 年在 Github 開源了。

研究團隊表示,此次開放原始碼是希望激勵相關愛好者思考這項技術新的應用和研究方向。

在戰績方面,ELF OpenGo 曾與 Leela Zero 在一場比賽中交手,最終以 200:0 的戰績獲勝。此外,它還在與世界級職業選手的對戰賽中,創造了 14 勝 0 負的紀錄。據官方介紹,在比賽中 OpenGo 使用單塊 GPU 每步 50 秒的搜尋時間(每步搜尋 8 萬個局面),而人類棋手並沒有限制下棋思考的時間。

從圍棋轉戰 RTS

看到這裡,AI 在圍棋界碾壓人類頂級選手已經成為一件非常輕鬆的事,不過,AI 研發的目的並不在此,圍棋因其遊戲規則和策略的複雜性被研究人員視為 AI 訓練的最佳試驗,一方面,AI 透過與人類的博弈對抗,可以快速提升其深度學習和思考能力;另一方面,其綜合大數據而獲得作戰布局,也可以為人類帶來更多的啟發性思考,可以說兩者在相互博弈同共同成長。

此外,圍棋的複雜性已經不能滿足 AI 的需求了。這些年,AI 的訓練場景已經逐步從圍棋、德州撲克轉向更為複雜的 RTS 即時策略性遊戲。做為經典 RTS 遊戲,《星海爭霸》因非完全資訊、作戰空間複雜、毫秒級決策等特點,而成為眾多團隊的研發目標。

目前,以 Google 為首的人工智慧公司在該領域探索也取得突破性進展。去年 10 月,Google 發表最新​​論文登上《Nature》雜誌,論文指出其研發的 AlphaStar 在排行榜單上超越了 99.8% 的活躍玩家,而且最高達到了《星海爭霸 2》人類對戰天梯的頂級水平,並給出了對戰影像資料。

此外,中國一家人工智慧公司啟元世界異軍突起,其研發「星際 AI」在最近的挑戰賽中以 2:0 戰勝了世界頂級職業選手。該研發團隊表示,公司自成立之初便圍繞《星海爭霸》開展星際 AI 的研發工作,其目的一是在遊戲行業為玩家們提供更好的遊戲體驗,二是透過 AI 智慧體的訓練,敲開通向通用人工智慧(AGI)的大門。

(本文由 雷鋒網 授權轉載;首圖來源:Flickr/Chad Miller CC BY 2.0)

延伸閱讀: