幫 AlphaGo 擊敗南韓李世乭的那個人：台灣資工博士黃士傑

AlphaGo 首戰擊敗南韓棋王李世乭，成為 9 日轟動科技界的大事。有人不免會拿漫畫棋靈王（棋魂）來做比較，一個在背後遙控人類的靈魂，指揮下贏了當代一等一的棋手。如果 AlphaGo 是佐為的話，那麼，與李世乭實際對戰的那位「阿光」人類棋手又是誰呢？答案揭曉：他是台灣師範大學資工博士，黃士傑。

在第一場比賽，根據職業棋手認為，首戰導致李世乭落敗的原因並不在於 AlphaGo 的強大，而是他的輕敵。最明顯表現是他的思考並不充分，所用的時間遠遠少於對手。

跟機器對戰與跟人類對戰的差異點在於，棋手原本會從現場對手的表現、下子的姿態來判斷對方的心情、狀況。但是與 AlphaGo對決，那個「人」只是一個替代電腦下子的工具。李世乭無法從這個棋手的表現來判斷，只能從對方下子的策略來觀察。

但是 AlphaGo 首戰的水準漂浮不定，在比賽開始前期犯下了一些低級錯誤，但後來又有一些妙招，讓李世乭難以判斷對手下棋的方式，並且可能是這個開始的錯誤導致李世乭的輕敵。

不過，如果他能與這位「阿光」多談談，或許就能多了解 AlphaGo 的「個性」。因為這位坐在他對面的人類棋手黃士傑，其實不光只是一個人類傀儡而已，他也是負責打造 AlphaGo 大腦的團隊核心人物之一。

▲ 之前 AlphaGo 擊敗歐洲歐洲圍棋冠軍樊麾（左）時，也是由黃士傑（右）擔任人類棋手。

「深藍」不是已經打敗過西洋棋王了嗎？圍棋有什麼難的？

有些網友說，早在多年前 IBM 的深藍不是已經在 1997 年打敗過棋王了嗎？這次 AlphaGo 打敗棋王又有什麼大驚小怪？

問題是那次深藍打敗的是西洋棋的冠軍，這次打敗的是圍棋冠軍。圍棋，被視為是目前難度最高的一項棋類比賽，難就難在圍棋的變化高出西洋棋許多。因此擊敗人類的圍棋冠軍，一直是科學界發展人工智慧的重要目標。

以複雜度來說：

西洋棋的複雜度為：10 的 123 次方。
中國象棋的複雜度為：10 的 150 次方。
日本將棋的複雜度為：10 的 226 次方。
圍棋的複雜度為：10 的 360 次方。

棋類比賽基本上都是利用搜尋樹展開演算法，用搜尋樹來判斷對手下子的可能性，然後依照一些資訊來進行優劣判斷，再來從多種可能的結果選出最好的一步來下子。

▲ 西洋棋每走一步，有 24 種可能性。而圍棋則每一步有 200 種，再算下去將無窮無盡。

在西洋棋裡面，電腦的搜尋樹可以利用棋子的位置、棋子的數量來判斷優劣，因此在樹的展開可以依照每個棋局的局面來往下進行深度的搜尋。但是圍棋的邏輯性沒有那麼強，比較難得到判斷的方式。甚至有時你問頂尖棋手為什麼當時要下某一子的時候，他也只能回答你「靈光乍現」，這也是為什麼科技人工智慧這麼想要在圍棋上取得成果的原因。

黃士傑，一位熱愛圍棋的資工人

黃士傑是土生土長的台灣人，業餘圍棋六段，台灣師範大學資訊工程系碩士、台灣師範大學資訊工程系博士。他在 2002 年的碩士論文為「電腦圍棋打劫的策略」，2010 年的博士論文為「應用於電腦圍棋之蒙地卡羅樹搜尋法的新啟發式演算法」。

他在這次比賽之後接受採訪時表示：「Deepmind 應該是在 2014 年底之前、在 AlphaGo 團隊出現之前就創建了。我本人喜歡下圍棋，棋力是台灣業餘六段，去年在德國的比賽我甚至贏過一位日本職業棋手。但 AlphaGo 肯定是比我強太多了。職業水準的圍棋軟體，應該最慢在 1-2 年之內就會在市面上普及。」

根據他在論文中表示，雖然電腦圍棋的研究開始於 1970 年，但是圍棋程式從未被人們認為是強大的。一直到 2006 年，當「蒙地卡羅樹搜尋」與「樹狀結構信賴上界法」出現之後，才帶來了圍棋程式的革命。

蒙地卡羅是一種大數法則的方法，使用隨機取樣，而不用把所有的可能都估算到。但是當取樣的次數越多，其所得出的平均值將趨近於理論值。這個方式應用在圍棋時，會隨機下子直到盤末，由此依據各點模擬的結果，來對於盤面進行優劣的評估，從中選出最好的下子方式。

這個方法多少帶有點運氣，但是當取樣數量越多的時候，誤差會相對變低。2006 年，法國科學家以蒙地卡羅方式發展出的 Crazy Stone 在第 11 屆電腦奧林匹克 9×9 比賽中獲得了冠軍。