玩德州撲克的「AlphaGo」來了,擊敗它可以拿走 20 萬美元

作者 | 發布日期 2017 年 01 月 15 日 21:52 | 分類 AI 人工智慧 , 科技趣聞 follow us in feedly

從 1 月11 日開始,5 名頂尖德州撲克選手將在匹茲堡的賭場展開爭奪,不過,其中一名選手卻不是人類。



在這項名為「人腦 VS. 人工智慧」的對決中,4 名職業選手 Jason Lee、Dong Kim、Daniel McAulay 和 Jimmy Chou 將分別與卡內基美隆大學開發的「Libratus」人工智慧系統進行挑戰。賽程為期 20 天,總共將對戰 12 萬手牌,獎金為 20 萬美元。

愛范兒配圖

▲ Dong Kim 曾在 2015 年與卡內基美隆大學的 Claudico 對戰過。(Source:CMU

AI 與人類對決不是什麼新鮮事,但是,重點來了,本次的比拚項目是德州撲克。

我們在下象棋或圍棋的時候,能夠看得到彼此手中的棋子、排兵布陣等,這種被稱為「完整訊息博弈」。德州撲克則不同,每個玩家手中的底牌只有自己知曉,其他玩家是看不到的,所以是「非完整訊息」(Imperfect information)。

鑑於德州撲克獨特的規則,AI 想要主宰比賽並沒有那麼容易。總之,與棋類遊戲相比,德州撲克對於 AI 來說更具有挑戰性,也是近來十分流行的人工智慧測試項目。

卡內基美隆大學的 Libratus 採用的是一種名為「奈許平衡」的對戰策略,在這一策略裡,只要其他玩家的策略保持不變,單一玩家就無法透過變換策略獲益。

Libratus 要做的就是辨識沒有希望的策略,進而更快地找到奈許平衡點。經過反覆的訓練後,Libratus 已經能夠忽略那些糟糕的路徑了。

不過,Libratus 並非唯一一個會玩德州撲克的 AI,就在卡內基美隆大學宣布 Libratus 出戰的幾天前,加拿大阿爾伯塔大學搶先發表了關於撲克 AI 的論文,表示他們的 DeepStack 是世界上第一個在「一對一無限注德州撲克」上擊敗了職業撲克玩家的電腦程式。

愛范兒配圖

上周,著名的論文網站 Arxiv 出現一篇題為《 DeepStack:無限下注撲克里的專家級人工智慧》(DeepStack: Expert-Level Artificial Intelligence in No-Limit Poker)的論文,作者是來自加拿大 Alberta 大學、捷克 Charles 大學、布拉格捷克理工大學的研究人員。

該論文顯示,DeepStack 在與 33 名人類選手進行的 4.4 萬手較量中,平均勝率為 492 mbb/g,一般認為人類玩家這一數據達到 50 mbb/g 就具有較大的贏面,而 750 mbb/g 就是對手每局都棄牌的節奏了。

值得一提的是,DeepStack 玩的是無限下注類的德州撲克,玩法比有限下注要複雜得多。

然而,DeepStack 雖然有先發優勢,但明顯引發的關注度不如 Libratus。

卡內基美隆大學模仿了 AlphaGo 的套路,賭場、機器與頂尖人類高手對決、20 萬美元獎金,這顯然比 DeepStack 團隊一篇論文更能吸引目光。

愛范兒配圖

(Source:PopularMechanics

與此同時,一些撲克專家也對 DeepStack 提出質疑,認為與其對戰的玩家中沒有頂級選手,而 Libratus 要面對的卻是全球排名在前的高手。

至於 20 萬美元的獎金最終將被哪方收入囊中,我們還得等上差不多 3 週時間。

(本文由 愛范兒 授權轉載;首圖來源:Flickr/Morgan CC BY 2.0) 

發表迴響