AI在六人桌德州扑克賽中戰勝人類選手

劉霞

2019年07月15日08:49 | 來源：科技日報

小字號

原標題：AI在六人桌德州扑克賽中戰勝人類選手

　　據美國《新聞周刊》網站近日報道，美國科學家開發出一種新的人工智能（AI）程序“合眾為一”（Pluribus），其在6人無限制德州扑克比賽中擊敗了6名全球頂尖選手。研究人員認為，這是人工智能發展史上的一座裡程碑，未來有望應用於生物醫學、安全等領域。研究發表於12日出版的《科學》雜志。

　　Pluribus由Facebook人工智能實驗室和卡耐基梅隆大學的研究人員攜手完成。在游戲中，Pluribus和職業選手共進行了10000手扑克牌比賽。在一種情況下，人工智能面對5名人類選手﹔在另一種場景中，5個版本的人工智能與一名人類選手對決（AI沒有相互配合）。研究人員發現，Pluribus的表現明顯優於人類。他們認為，這是“決定性的勝利”。

　　研究報告共同作者、卡內基梅隆大學計算機科學教授托馬斯·桑德霍爾姆博士素有“德州扑克AI之父”的美譽，他表示：“在AI領域（至少自1970年以來）和博弈論領域（至少從1950年開始），扑克是測試非完美信息游戲解決能力的主要基准。”

　　桑德霍爾姆解釋說，人工智能已經在國際象棋、跳棋、圍棋、雙人限制和雙人無限制扑克等雙人零和游戲中擊敗了人類。在雙人零和游戲中，隻能有一方可以獲勝，用博弈論的術語來講，這些人工智能所做的都是在找到一個接近納什均衡的策略。所謂納什均衡策略就是指一系列能夠使自己預期收益最大化的策略。但由於六人游戲規模大，人數多，上述辦法很難擴展到六人游戲。

　　因此，研究人員需要找到一種方法來擺脫納什均衡，桑德霍爾姆解釋道：“這種策略計算起來要困難得多，但最新算法‘強大且可擴展’，最新勝利‘是AI在多玩家游戲領域的第一個裡程碑’。”

　　桑德霍爾姆表示，這一研究所涉及的戰略推理技術未來有望在多個領域“大顯身手”，從扑克、視頻游戲到投資銀行的戰略優化、政治運動等，不一而足，其還可以引導進化和生物學適應——例如醫療計劃和合成生物學等。此外，該技術還可用於電子戰、安全領域等。

　　 總編輯圈點

　　谷歌的“阿爾法狗”在圍棋對弈中大敗李世石后，有人指出：別著急，人工智能還沒打贏多人德州扑克呢。能在一對一的博弈中獲勝，確實是人工智能的重要成就。不過，現實生活中很多競爭場景並非雙人對決，而是多人參與，股票投資、職位競選、招投標活動等等就是如此。因此人工智能在6人德州扑克中獲勝，是一座新的裡程碑。在此基礎上，人工智能有可望為多人競爭的更為復雜的現實場景，提供最優解決方案，從而勝任更多任務。

(責編：趙爽、庄紅韜)

分享讓更多人看到

人民日報報系

旗下網站

AI在六人桌德州扑克賽中戰勝人類選手

相關新聞

客戶端下載

熱門排行