AlphaGo 是否隱藏實力？看 DeepMind 團隊如何回應

前後兩次 AI 與人類的公開對弈，讓大家意識到人工智慧已不再是科幻電影的幻想。但驚歎 AlphaGo 出色戰績和表現同時，網上也出現不少意見指其實 AlphaGo 有意隱藏實力，故意讓人類輸得不難看。就筆者在烏鎮現場觀察，中國媒體似乎對該議題相當感興趣，多次向 DeepMind 團隊提出類似的問題。到底 AlphaGo 是否真的有自我意識並示弱？且看研究團隊如何回應。

AlphaGo 有意識隱藏實力？只是最大化獲勝機率

先前《AlphaGo 進步神速》的報導中提到，AlphaGo 能屢屢擊敗人類頂尖棋手，在於其先進的機器學習演算法，即策略網路和價值網路的結合分析，以對手的絕對勝利到 AlphaGo 的絕對勝利為標準，預測所有可行落子位置的結果再選擇最佳位置。因此對於 AlphaGo 是否有意識控制贏子數的疑惑，DeepMind 研究團隊在賽後解釋。

DeepMind 的聯合創始人兼 CEO Demis Hassabis 表示，AlphaGo 的目標總是將獲勝機率最大化放在第一位，它會透過尋找確定的搜索途徑實現最低風險的獲勝機會。

▲ David Silver。

DeepMind 研究科學家兼 AlphaGo 團隊負責人 David Silver 補充，簡單而言，AlphaGo 會將獲勝機率盡量擴大，以求在對弈中取勝，而進一步擴大勝出的距離（子數）是未來需加強的地方。但目前而言，AlphaGo 的行為會傾向為了取勝而放棄更多贏子數，只為了降低不能取勝的風險，即使是很小的差距仍會納入考慮（可理解為面對「贏 3 子，90% 勝率」和「贏 1/4 子，95% 勝率」兩種情況，AlphaGo 傾向選擇後者來降低風險）。