【專訪】AI 熱潮持續發燒:AlphaGo Zero 跳脫思維框架、挑戰人類知識

作者 | 發布日期 2017 年 12 月 21 日 15:16 | 分類 AI 人工智慧 , 尖端科技 follow us in feedly

閱讀棋譜是學棋過程中很重要的一環,初學者可以藉由讀棋譜,吸收高手的經驗與思維,習得自己還未能想到的行棋方式,快速提升應戰能力。2016 年以 4:1 擊敗李世乭的 AlphaGo,正是以此方式訓練出前無古人的棋術,它「吸收」人類棋譜、歸納出輸贏的模式,再藉由演算法推展出獨特的棋藝。但 AlphaGo 風光了一年,就被進化版的 AlphaGo Zero 以 0:100 橫掃,也被掃入歷史的看板中,由人機對弈所帶動的 AI 熱潮,則邁入下一個里程。



不像 AlphaGo 先有資料訓練的過程,Zero 一開始就用兩套程式互相對弈,但這兩套程式只有規則知識,沒有經驗知識,只要不違背基本的規則,例如兩個子疊在一起,下棋方法不限;Zero 從每次比賽的輸贏,累積經驗與修正錯誤,再經過千千萬萬次的比賽後,越來越厲害。專精大數據、AI 研究的資策會副執行長余孝先博士,娓娓道來兩者本質上的差異。「所以這個學習方式是不藉由前人的知識,Zero 一開始是一張白紙」。

余孝先精通各種棋類,更是圍棋三段好手,談到圍棋的博大精深,他認為以人類的思考方式來看,圍棋太過複雜。「圍棋不像西洋棋,國際上的比賽大概七十手以內就會結束,輸贏就分出來了,但圍棋通常要好幾百手,如果要預測你怎麼下我怎麼回,想到底要想好幾百層!」

▲ 資策會副執行長余孝先博士精通各種棋類,更是圍棋三段好手。(Source:科技新報)

因此從高手棋譜衍伸出來的棋法,能幫助選手應戰。余孝先以象棋作比喻:「當頭炮」是最常見也具攻擊性的開局方式,也就是先手走中炮,直接威脅對手中兵,而後手則常以炮或馬作防守,術語是「炮 8 平 5」或是「馬 8 進 7」,這些套招、套式都是前人經驗的累積;下圍棋也一樣,當對手下在某個角時,雖然整個棋盤可以下的點有 360 個位置,但不用把每個點都想過一遍,因為前人已歸納出約幾十種的回應方式。

可是當 Zero 完敗 AlphaGo,代表 AlphaGo 之前習得的人類知識,有一部分是不正確的,而這個知識就像是框架,把我們的思維限制住。「就好比下象棋,面對當頭炮的招數有 10 種,每個人都從其中挑一種,但或許最好的答案是第 11 種,我們卻被訓練到永遠不會去想第 11 種。」余孝先強調 Zero 讓我們發現之前人類高手沒有想到的招數,當我們一直在學人類高手的技法,反而被侷限了。

 

AlphaGo Zero 為什麼這麼強?

Zero 背後的技術是「增強式學習」(Reinforcement learning),或稱強化學習,來自於心理學的行為主義理論,也就是外界的環境回饋讓你去增加對你有利的事情,是自主學習很重要的技術。例如狗看到主人搖尾巴發現有東西吃,就會增強這樣的行為,Zero 的設計也是如此。當它發現上次這樣下會贏,或許這樣的下法比較好,如果上次輸了,那就改變方法;再藉由數千萬次的對弈,慢慢增加信心,當 100 次比賽贏了 99 次,便可以確定這樣的策略比較好。

其實增強式學習也用在人類的棋手身上。「例如有些對弈一路領先,但卻在最後下錯棋,整個結果大翻盤,這樣的結果非常深刻,會一輩子記得,之後遇到相同的狀況就不會犯錯。」

「話雖然如此,人類一輩子可以下幾盤棋?人類不僅學習速度有限制,學習也有高峰,例如世界級的圍棋好手都是在 30 歲前達到高峰,之後因為智力體力衰退,成績會慢慢衰退。」余孝先從自身的經驗,分享棋手職涯中所面臨生理上的挑戰。

▲ 余孝先強調 Zero 讓我們發現之前人類高手沒有想到的招數。 (Source:科技新報)

人類棋手也會受到下棋時心理狀態的影響,余孝先觀察到李世乭跟 AlphaGo 下第一局時,他一會兒抓頭一會兒喝水,可以看得出非常緊張,因為喝水頻率高的不尋常。第一局輸後李世乭更緊張,而 AlphaGo 勝不驕敗不餒穩紮穩打,「所以在情緒上人類就輸了,而現在技術上輸更多。」

 

台灣的角色在哪裡?

當 Zero 掀起了另一波 AI 話題時,回到台灣的產業現況,我們的角色在哪裡?從大環境聚焦回己身,你我的機會又在哪裡?

余孝先指出 AI 的產業有兩類,第一類是「把 AI 產業化」,提供解決方案給其他廠商,例如沛星科技;第二類是「把產業AI 化」,用 AI 來提升自己的競爭力,台灣的工廠大多是屬於第二類,例如製造業導進 AI,以提升製程良率、減少呆料、降低機器設備異常當機現象。「因為(製造業)產業大,面臨的使用者多,客戶多,所以容易把產業培養起來,是台灣最有機會的產業」,余孝先指出。

「此外金融和醫療照護在不同國家的體系不一樣,所以國外的解決方案要直接進來是不容易的,如果我們可以把自己的內部限制解除,可以發展很快,也都是機會。」

零售則是另外一項可發展的產業,「很容易做、技術門檻較低,但困難是台灣的市場太小,我們擁有的數據是人家的千分之一、百分之一,但還是可做,只是需要了解先天上的障礙。」

對於 AI 創業風潮,余孝先建議可以從服務業切入,門檻較低,製造業則最難切入,需要具有豐富的 domain knowledge。若年輕人有志投入金融、醫療或製造等領域,除了進入大公司的內部新創團隊外,也可以加入研發法人,因為從法人分拆出來的新創公司,就會有一定的規模基礎,此外研發法人長期協助中小企業進行轉型,年輕人可從職涯中接觸到不同的產業案例,幫助自己累積一定的實績!