AlphaGo 已經很厲害了,和柯潔對戰還有意義嗎?

作者 | 發布日期 2017 年 04 月 11 日 13:09 | 分類 AI 人工智慧 , Google follow us in feedly

你可能已經知道了,Google 旗下的人工智慧 AlphaGo 要和中國頂級圍棋選手柯潔決戰了。4 月 10 日下午,中國圍棋協會、Google 和浙江省體育局於北京中國棋院舉辦的發表會上宣布了這個訊息。



對戰的地點在中國浙江烏鎮,對戰時間是 5 月 23 日至 27 日,比賽採用中國規則,三番棋,無論輸贏,每方 3 小時,5 次 1 分鐘讀秒。

除了與柯潔對戰,此次還將組織一場配對賽和一場團隊賽,配對賽是連笑、古力分別與 AlphaGo 組隊進行比賽,團隊賽則是柯潔、周睿羊、時越、唐韋星和陳耀燁五名人類棋手組隊與 AlphaGo 對戰。

這可能是 AlphaGo 自去年戰勝李世乭之後最高規格的一次比賽。今年 1 月,AlphaGo 的 2.0 版本曾化身 Master 在網路圍棋網站下贏許多高手。其中已包括柯潔,但隨後柯潔爆出住院消息,疑似帶病與 AlphaGo 對弈。且線上對弈也非正式比賽,所以從嚴格意義上來說,AlphaGo 還沒有正式成為地球上最強的圍棋選手。

這一次,烏鎮舉辦的對弈似乎是為了徹底讓人類死心。但對大多數人來說,可能已有對比賽結果的預期。畢竟,Master 在年初 60 場大戰的不敗戰績,已充分說明。

既然 AlphaGo 這麼厲害,那麼還讓它和柯潔比賽有意義嗎?

答:當然有意義。

標題的問題,其實並不來自媒體,而是來自馬雲。

剛過去的清明節假期裡,馬化騰、馬雲和李彥宏同時站在 2017 中國(深圳)IT 領袖峰會的台上,探討關於人工智慧的話題。馬雲對 AlphaGo 式的人工智慧提出十分尖銳的質疑:

大家把 AlphaGo 說得天花亂墜很恐怖的樣子,我個人覺得,So What?

在發表會上,Google 大中華區總裁石博盟對這個問題似乎有備而來。現場回答的 3 個問題中,都在解釋為什麼 AlphaGo 與人類棋手對弈如此重要。

第一個問題就是:AlphaGo 和柯潔對弈是否有意義?

這個問題的答案是肯定的,但並不是外界理解的「這對 Google 來說是一種宣傳行為」。

石博盟解釋,AlphaGo 在圍棋方面已經做得很好,但是 DeepMind 的人工智慧科學家和世界各國的圍棋頂尖選手共同探索的結果。在這個過程中,其實並不是人類與人工智慧對戰,而是科學家和圍棋選手共同探索。

科學家探索的是人工智慧,圍棋選手探索的是圍棋藝術。AlphaGo 每一次升級,都意味著 DeepMind 的人工智慧科學家對「如何在有限資訊下做出更好選擇」這問題有更深刻的認識,這問題正是讓人工智慧理解人類、產生思維的關鍵。

▲ 在抓取棋局資訊後,AlphaGo 會根據策略網路(policy network)探索哪個位置同時具備高潛在價值和高可能性,進而決定最佳落子位置。在規定的搜尋時間結束時,模擬過程中系統最頻繁考察的位置將成為 AlphaGo 的最終選擇。經過先期的全盤探索和過程中對最佳落子的不斷揣摩後,AlphaGo 的搜尋算法就能在其計算能力上加入近似人類的直覺判斷。更多介紹可參考《擊敗了李世乭的圍棋人工智慧「AlphaGo」究竟是什麼?》。

對棋手而言,柯潔也談到,與人工智慧的多次對弈十分有收穫。AlphaGo 勝過李世乭後,中國圍棋隊的成員多次演練所有比賽,從中發現很多新思路。

在以往的圍棋比賽過程中,總有一些「套路」是不會打破,這些套路曾被奉為人類經驗知識的聖殿,是不可變更的,但 AlphaGo 正是透過突破這些規矩,達到新的高峰,這對人類本身來說也是一種啟發。這次的比賽,中國圍棋隊將會針對人工智慧研究一些針對性的著法,但目前還無法透露更多資訊。

第二個問題:AlphaGo 在全面超越人類之後,是否會舉辦機器人與機器人的對戰?

針對這個問題,石博盟否定了。

AlphaGo 在訓練的過程中本身就會自我對弈,與人類比賽一方面是為了讓人工智慧更理解人類,另一方面是透過比賽這種形式促進人類對人工智慧的認知,同時也讓更多人關注人工智慧和圍棋這項運動。

機器與機器的比賽,在 Google 看來才是真正沒意義,所以 Google(至少暫時)不打算舉辦任何機器對機器的比賽。

第三個問題是:發表會當天,深圳正在舉辦一場人類與人工智慧的德州撲克比賽,Google 對此有什麼看法?

石博盟說,無論圍棋還是德州撲克,這種與人工智慧的遊戲本身並不重要。重要的是透過圍棋和德州撲克這樣的手段模擬人的思維,提升它的認知與思考能力。這也是為什麼這次賽程設定配對賽和團隊賽的原因。

所謂的配對賽,是指人類棋手和 AlphaGo 組隊與另一組人類棋手對弈。在這種比賽型態下,人類和人工智慧會互相彌補對方的思考盲區。

所謂團體賽,則是讓多位人類棋手共同與 AlphaGo 比賽,這可以讓 AlphaGo 學到群體決策與個體決策的區別。

兩者都會更進一步讓 AlphaGo 感知人類在進行圍棋博弈時的思考路徑,也可以讓科學家更能觀測到深度學習演算法在應對不同情況下的表現。

而人工智慧在深度學習能力上的提升,最終會落在馬雲所指那些「有用」的領域。

比如最近剛在中國上線的 Google 翻譯最新版就搭載了神經網路學習機制,它在準確率上的進展比傳統翻譯機在過去 10 年的進展都要大。或者更遠一點說,這樣的技術還能為醫生在偵測和治療癌症、糖尿病等疾病時提供幫助。

這並不是 Google 團隊自吹自擂,與馬雲同台登上中國(深圳)IT 領袖峰會的馬化騰其實也用類似的觀點反駁馬雲的質疑:

騰訊旗下的人工智慧棋手「絕藝」也曾在圍棋網站擊敗柯潔 11 次,3 月 19 日又奪得世界圍棋 AI 比賽冠軍。馬化騰說 AlphaGo 的出現延伸了人類的認知範圍和對人工智慧的理解。就像在金融、醫療、無人駕駛的模擬測試一樣,研究這過程本身會給人類帶來大量的經驗和理論。

這令人想起去年底上映的科幻電影《異星入境》,在這部「語言學大片」裡討論一個許多科幻電影只帶過的重要問題:當我們與另一個物種接觸時,如何透過語言讓我們互通。影片中,中國與外星生物溝通時就使用了「麻將」為語言。

在 AlphaGo 這裡,圍棋就成了人類與人工智慧這種「生物」交流的方式。儘管現實並不像科幻電影那麼浪漫,但 DeepMind 的科學家確實從 AlphaGo 每次對弈中更了解深度學習,而 AlphaGo 也在過程中更了解人類棋手在想什麼。

對了,這次比賽之所以選在浙江烏鎮,是因為浙江自古圍棋氛圍就很濃厚。浙江的爛柯山,就是傳說中人類旁觀仙人下棋,回家後卻發現已過百年的地方。所以從某種程度上說,你看的並不是圍棋比賽,而是第三類接觸。

不知道這個答案,能否讓那些覺得 AI 下棋只是作秀的人滿意?

(本文由 PingWest 授權轉載;首圖來源:Flickr/2benny CC BY 2.0)

延伸閱讀: