Google AlphaGo 的勝利:不是電腦打敗人類,而是人類打敗人類

作者 | 發布日期 2016 年 01 月 30 日 12:00 | 分類 AI 人工智慧 , Facebook , Google follow us in feedly

「珍珠港遭到空襲!這不是演習!這不是演習!這不是演習!」

——2016 年 1 月 28 日凌晨




從 28 日開始,一條聲稱某 AI 在 19 路棋盤上分先戰勝樊麾二段,並且論文已登上 Nature 的消息刷爆了朋友圈。一開始,就像以往的那些「大新聞」一樣,大家都認為是標題黨,甚至某業餘 7 段還查驗到其論文尚未被 Nature 審核通過。

然而隨著時間的推移,越來越多的近距離詳細消息傳來,開始有人相信消息的真實性。圍棋圈內的各種微信群、朋友圈都在不斷地爭論,相信的人越來越多,不信的人也堅持己見。

終於,在接近凌晨兩點,又一條最新報導來了,這次還附帶著棋譜:《面對 Google 圍棋 AI,人類最後的智力驕傲即將崩塌……》(雖是真消息,但稍有標題黨之嫌)至此,看到棋譜的所有人幾乎都相信了:人工智慧 AlphaGo,實現了里程碑式的一步。

 

首先,在客觀上要肯定 AlphaGo 實現的水準進步

樊麾二段,雖然以歐洲冠軍聞名於世,但其實圈內誰都知道他是一名中國旅歐教學的職業棋手。

雖然遠離東亞職業一線,但樊老師的水準仍然是不容置疑的,他依然有著職業的水準(雖然是較弱的職業),一般的業 6 仍然是比不上他的。

AlphaGo 在正式比賽中對樊老師 5:0(棋譜已可見),據說加上非正式比賽的總分為 8:2(已確認),再加上棋譜裡 AlphaGo 顯示出的驚人表現,我們可以認為,人工智慧在圍棋上的水準已經邁入了職業的大門。

說的更明白點,之前的 AI 在蒙地卡羅樹狀搜尋的幫助下雖然取得了革命性的進步,戰勝了絕大多數的人類,但人類中能戰勝那些 AI 的人數可能仍然在近百萬的級別。

而自今日(其實已經是 3 個月前了)的 AlphaGo 起,能在圍棋盤上戰勝 AI 的人類人數可能已經不到千人了。

按照 Facebook 人工智慧研究院田淵棟老師的說法,這個消息在相關研究圈內應該早就不是新聞了。

甚至回想一下 28 日祖克伯在 Facebook 上突然發聲支持自己的研究團隊,也因為是知道了 Google 團隊的成果即將發表,所以想要搶佔一個在輿論的位置。

(田老師參與的 Facebook 的研究團隊,是 Google 現在最大的競爭對手,田老師他們使用的方法應該不太一樣,雖然他們暫時落後,但我同樣也很期待他們的下一步進展)

總之,從事實看來,這不是演習已經是顯而易見的事實。

接下來談點個人對人工智慧的粗淺理解。

 

蒙地卡羅樹狀搜尋之後,我看到了新天地

近些年來,儘管在蒙地卡羅樹狀搜尋的幫助下,AI 實現了革命性的進步,達到了能戰勝大部分人類的水準(中等業餘 5 段),但隨著摩爾定律的走向終點,電腦硬體的發展速度在舊有道路上暫時無法按以前的速度爆炸發展下去,大家都認為僅憑蒙地卡羅樹狀搜尋是無法幫助 AI 戰勝人類的。

依據個人的理解,我曾將圍棋的思惟過程分解為四步的演進:常識→棋感→計算→判斷。

大約一年前,我曾和李喆七段就此問題進行過簡單討論,當時我認為蒙地卡羅樹狀搜尋的成功主要在於為人工智慧建立了「棋感」,而以往的人工智慧只能在「常識」和「計算」具有天然優勢。

在蒙地卡羅樹狀搜尋之前,雖然電腦憑藉強大的計算力可以積累大量「常識」,但由於「棋感」的缺失,人工智慧無法對計算方向進行有效的篩選,最終就不免淪於蠻力搜索。

而蠻力搜索雖然可以在一定程度上實現高水準的「計算」,甚至很多其他棋類都在這一環節上被人工智慧打敗,而由於圍棋的過度複雜和摩爾定律結束對電腦發展前景的限制,走到這一步仍然無法讓人工智慧戰勝人類。

Thinking_leiphone0129

▲ 上圖為電腦眼中的國際象棋落子思路,而下圖為電腦眼中的圍棋落子思路。(Source:Google deepmind 官網 AlphaGo | Google DeepMind)

Go Thinking_leiphone0129

而蒙地卡羅樹狀搜尋出現後,憑藉大量儲備的棋局,透過勝負概率來判斷下一步著點以做為計算方向,極大的提高的計算效率,所以 AI 的水準才完成革命性的進步。

而這次的 AlphaGo,使用了深度神經網路與蒙地卡羅樹狀搜尋相結合的方法。

依據已經能看到的 Nature 上的論文,研究者們在 AlphaGo 中加入了兩個深度神經網路,以 value networks 來評估大量的選點,而以 policy networks 來選擇落子,並且開發了一種新式算法來結合蒙地卡羅樹狀搜尋和以上兩個神經網路。

AlphaGo Neural network structure_leiphone0129

▲ 上圖為 AlphaGo 使用的神經網路結構示意圖,來自原論文。

在這種結合下,研究者們結合參考人類職業對局的監督式學習,和 AI 大量積累自對弈實現的深度學習,來訓練和提高 AI 的圍棋實力。

在蒙地卡羅樹狀搜尋之後,我看到了新的天地。這種結合以及新式的思路,讓人感到前景無限。

最後談一談,我認為我們應該保有的態度。

 

如何面對人工智慧?

這裡,我首先想引用李喆七段說的話:

「我們已來到兩個時代的連接處,無論你是否願意,這都是一個需要接受的事實。工具無善惡,善惡在人心。未來的路通往何方,將由我們自己決定。」

從凌晨到早上,朋友圈裡的評論區一直爭論不休,甚至某世界冠軍一直在說「不信」直到另外兩位一線棋手告訴他,已經可以看到棋譜了……

面對這個事件,接下來將會有很多的爆炸性新聞報導,以及各種各樣的討論。

我們要知道:

一.人工智慧的確實現了很大的進步。

這次的進步可能是革命性的,這次新聞宣稱的 AI 取得的成績並不是「標題騙人」。

二.人工智慧還沒有戰勝人類(什麼所謂「人類最後的驕傲陷落」都屬於「標題騙人」)

但朝著這個方向邁出了一大步,而且是在很多人在蒙特卡洛之後不看好 AI 下一步發展的情況下,來了一個突然襲擊(Google 從開始研究到出成果再到發表,一直憋一個大新聞憋這麼久也真是能忍)。

三.人工智慧戰勝人類的時點,可能比很多人想像的要來得更早了。

不是之前設想的生物電腦或者量子電腦出現後,甚至都不是新材料取代矽晶片之後,在這個時代就有可能出現了。也許是 50 年後,也許是 20 年後,甚至可能是 10 年後。

從小學時開始,我就痴迷於許峰雄教授對於電腦國際象棋項目的研究和成就,一直追蹤到 97 年「深藍」戰勝卡斯帕羅夫。(就是在那之後不久,我才從國際象棋轉投了圍棋……)

Feng-hsiung Hsu_leiphone0129

▲ 上圖為第一個打敗人類的電腦國際象棋程式「深藍」之父許峰雄。

許教授離開 IBM、前往亞研院並聲稱準備致力於做為最終問題的電腦圍棋難題之後,我仍然一年年期待著許教授的後續動作。

然而十多年過去,等來的卻是無數的後來者。

這也挺好,人類就是不缺後來者。

看許教授對當年研究過程的講述,最大的感受就是:

其實並不是電腦打敗人類,而是人類打敗人類。

大量的電腦專家,配合大量的國際象棋職業棋手,在算法上不斷革新,再搭乘上摩爾定律的東風,不斷的失敗再重來、輸了再修正,最終才解決了電腦國際象棋難題。

卡斯帕羅夫,是敗給了數以百計人類專家的智慧。

圍棋也會是一樣,電腦——今天說人工智慧更合適,戰勝人類的那一天遲早會來,大部分人都從來不否認這一點。

爭論,始終在於這一天的早晚。

而棋手和圍棋從業者們,出於可以理解的感情,總是希望並認為這一天不會來得那麼快,但他們絕對不會拒絕甚至仇視這種進步。

其實我看到的很多人,都一直期待並讚許著人工智慧的進步,甚至很多職業高手還親身參與和幫助著電腦圍棋項目的研究。我們努力打造著一個「大玩具」,一個能戰勝自己的「大玩具」。

所以最終的成功,是我們人類自己的成功,而不應該對電腦感到恐懼。

同時,這「大玩具」也不只是好玩而已,人工智慧對於現代乃至未來科技的發展有著極大的意義,這意義甚至會超出當年原子彈研究的後續紅利。

所以不要害怕,不要煩惱,讓我們期待著人工智慧在圍棋上戰勝人類的那一天的到來吧。

我之前一直認為在我有生之年是看不到這一天的,然而現在看來,我錯了。

我一點也不失望,反而感到很興奮,很激動,並且期待以 Google 和 Facebook 為首的前沿研究團隊們的進一步的表現。最後的最後,恭喜 Google,恭喜圍棋,恭喜人類。

(本文由 雷鋒網 授權轉載)

延伸閱讀:

發表迴響