想戰勝南韓九段棋手,Google AI 需要九段高手陪練

作者 | 發布日期 2016 年 01 月 29 日 13:41 | 分類 Google , 人工智慧 , 尖端科技 follow us in feedly
雷鋒網配圖

28 日,大家都在興奮地傳播著一條消息:Google AI 在圍棋戰勝了歐洲冠軍。興奮的理由是,人工智慧在被定義為最難攻克的圍棋上戰勝人類職業棋手。人類與 AI 之間的最後一堵防護牆,正在一點一點坍塌。



Google 使用的人工智慧軟體是 AlphaGo,由 Google 去年收購的人工智慧公司 DeepMind 研發,其中兩個神經網路有著關鍵的作用,一個叫決策網路(policy network),負責選擇下一步走法,另一個叫值網路(value network),負責預測棋盤上不同的分布會帶來什麼不同的結果。

此次 AlphaGo 戰勝的是歐洲圍棋冠軍樊麾(法國國家圍棋隊總教練),AlphaGo 以 5-0 完勝。但 AlphaGo 真正的挑戰是 2 個月後,與南韓圍棋九段高手李世乭的對弈。而樊麾雖為歐洲圍棋冠軍,但實際上也僅為二段水準。高手與頂級高手之前也存在很大差距,不知道在 AlphaGo 與李世乭之間,隔了多少個樊麾。之前圍棋軟體 ZEN、Crazystone 都戰勝過九段圍棋高手,不過都是在對方讓子的前提下。

雷鋒網配圖

▲ 樊麾與 AlphaGo 的對弈棋譜,黑方為樊麾,白方為 AlphaGo。

圍棋到底有多難?在 19×19 的棋盤內,共有 361 個點,就機器學習的角度而言,圍棋的計算最大有 3361 次方種局面,大致的體量是 10170,而已經觀測到的宇宙中,原子的數量才 1080。而相較之下,國際象棋每一步平均只有 35 種可能性的走法,最多只有 2155 種局面。

如此大的計算量無疑是對人工智慧的一大挑戰,但實際上,人工智慧是與人類一樣,透過不斷模仿而戰勝對手的。一個圍棋愛好者向雷鋒網記者表示,人工智慧其實是一個模仿高手,經由記住大量高手在以往對弈中的棋譜,並不斷練習,從而研究出新的招數。

「圍棋 2500 年,積累了很多棋譜,棋譜除了對開局定式的研究,然後就是很多高手實戰中下出比較有借鑒意義的棋局。電腦能夠記住 3,000 萬步棋譜(Google 這個就是先用這些來訓練的),人類是記不住的,很多時候,要依靠現場的純腦計算。就像職業棋手懂得對現有棋譜進行拆解一樣,拆解過程研究出新的變化,因為有時棋譜象徵著某一個招數達到最優,因為是當時最厲害那個人下出來的,但後人總可以超越,Google 這個特點就在於能夠在棋譜訓練中計算出新的變化(走法),否則充其量只能和人類打平手的水準。」

除了需要記住大量棋譜,人工智慧還需要一個高手來讓自己不斷提高。ZEN 早年就拉上日本一流高手,九段棋手武宮正樹做為陪練,2012 年 3 月,在武宮正樹讓五子和四子的前提下,ZEN 連勝兩盤。武宮正樹「宇宙流」式下棋特點,也被 ZEN 模仿去了。因此,AlphaGo 如果想戰勝李世乭,最快的方式是找到一個同水準的高手做為陪練,最好是熟悉李世乭下棋特點的人。因為,留給它的時間已經不多了。

雷鋒網配圖

▲ 李世乭

對於人類來說,因天分和後天努力程度,每個人提升速度會不一樣,有人 20 歲就能躋身世界冠軍,有人窮盡一生也入不了高手榜。但無論如何,在很多人眼裡,圍棋並非一蹴可躋。就比如最近引起輿論譁然的「真瘋叔叔」的「6 天速成法」,宣稱可以讓成年人在 6 天之內,圍棋水準從零基礎提高到業餘一段,不過回應他的,是來自圍棋界的各種嘲笑。

6 天從零基礎提高到業餘一段,如果放在人工智慧身上,或許有這個可能。不過想要從職業二段挑戰職業九段,贏得可能性並不大。圍棋是起源於中國的博弈遊戲,在亞洲的流行更加廣泛,在歐美等地區,圍棋的普及度還較低,這也就是為什麼會出現一個二段棋手成為歐洲冠軍。在這種情況下,AlphaGo 很難遇到一個頂級高手,也就妄論戰勝頂級高手了。

不過,圍棋的複雜度與挑戰難度,令其成為人工智慧最想攻克的難題。一個多月前,DeepMind 的 CEO Demis Hassabis 在一個採訪中透露,他們的秘密團隊可能將破解圍棋。Hassabis 在談到這個可能時表現得很興奮,因為在他看來這是個了不起的挑戰。「它不像國際圍棋那樣需要蠻力,它實際上是漂亮的,有規律可循、有形狀可追的,而這些通常是電腦不擅長的,因此它非常了不起。」

除了 Google,Facebook也在進行 AI 攻克圍棋的測試。就在《Nature》報導了 AlphaGo 戰勝樊麾的前一天,Facebook 也在 arXiv.org 上更新一篇用卷積神經網路和蒙地卡羅樹狀搜尋相結合來解決圍棋問題的新論文。Facebook 人工智慧實驗室負責人 Yann LeCun 在論文中表示,圍棋是能驗證各種學習技能結合的好案例,包括模式識別、問題解決和規劃等,也是一個可以用來測試新想法的工具,包括機器學習、推理和規劃的結合。因此,戰勝圍棋高手,不僅僅是一場遊戲,更重要的是人工智慧的突破。而人工智慧對於人類的影響,將是無限可能的。

從國際象棋的經驗看,1997 年人工智慧第一次打敗人類後,直到 2006 年,人工智慧在人類這裡再無對手。而人工智慧想要在圍棋上完全戰勝人類,還需要不斷地練習。至少這次,贏得可能性很小。

(本文由 雷鋒網 授權轉載)

延伸閱讀:

發表迴響