首页 > 科技快讯 > “赌神”的武器:人工智能是如何征服扑克游戏的(三)

“赌神”的武器:人工智能是如何征服扑克游戏的(三)

神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。

编者按:对于德州扑克的职业选手来说,能成为赌神应该是自己的梦想了吧?但是怎么才能成为赌神呢?对这个问题感兴趣并且找到解决方案的,却是数学家与程序员。真正的高手都知道打牌要虚实结合。但到底怎么个虚实结合?应该多少是虚?多少是实?扑克的本质是什么?是靠运气还是技艺?不管扑克玩家自己有没有意识到,或者想不想知道,这种游戏的核心始终都是约翰·冯·诺依曼所揭示的最大化问题。文章来自编译,篇幅关系,我们分三部分刊出,此为第三部分。

划重点:

就算是最优秀的玩家,也得靠运气来决定大部分的结果

最好的职业选手将可拿到投入约 5% 到 10% 的回报

新一代的人工智能工具只是扑克技术更漫长的创新模式的延续

AI 其实并没有改变了扑克,而是揭示了它的本质

相关阅读:

“赌神”的武器:人工智能是如何征服扑克游戏的(一)

“赌神”的武器:人工智能是如何征服扑克游戏的(二)

运气为王

超级豪客赛的第二天,刚过午夜,德国的职业选手 Christoph Vogelsang 把手上的筹码全部押出去跟注了,他手上拿了一张 K 和一张 9 ,另一位玩家手上拿的是 A 和 J。事实上,按照 solver 的说法,跟注是正确的玩法——但尽管如此, Vogelsang 还是输掉了这手牌,以第六名的成绩被淘汰出局。如果是常规的扑克比赛,玩家随时可以离开牌桌,兑现自己的筹码,但扑克锦标赛不同,这种比赛要求玩家得不断比下去,直到输掉所有筹码或赢得所有筹码。奖金就从参赛选手交的入场费里面出,大小要看玩家呆在游戏里的时间有多久。以拿到所有筹码告终的人将拿到第一名奖金(本次锦标赛的为 320 万美元),坚持到倒数第二的幸存者获得第二名(200 万美元),依此类推,直到最后一名进入钱圈的人(in-the-money finisher),这次的是排名第五的人(可拿到 63 万美元)。Vogelsang,以及所有在他之前被淘汰的选手,一分钱都没拿到。

鉴于玩家在三天内才能看到几百手的牌,样本量很小,如果光凭一次扑克锦标赛就想找出这个领域的最强玩家的话,那一定是很不准确的。就算是最优秀的玩家,也得靠运气来决定大部分的结果——如果把参加锦标赛的 26 名人类玩家通通用 26 个经过完美编程的扑克机器人来取代的话,也会有机器人被第一个淘汰,最后胜出的也只有一个机器人,尽管它们都采用了相同的最优策略。

扑克玩家往往会放眼长远,把锦标赛的买入看作是投资,随着时间的推移,自己能拿到的平均回报多多少少会是可预测的。职业玩家 Ike Haxton 说:“如果比赛相对艰难,场上玩得最差的玩家损失的买入费可能会高达 30% 或 40%。”他说,实力强一点的业余选手的平均损失预计应该会达到所投入的资金的 15%,而从长远来看,最好的职业选手将可拿到投入约 5% 到 10% 的回报。

为了抑制短期内出现的巨大财富波动,很多职业选手都同意在锦标赛开始前就相互交换的奖金百分比达成一致——比如说,我同意把我赢得的奖金的 5% 给你,如果你同意把你赢的钱的 5% 给我的话——或者把他们未来赢得的赌注卖给外部的赞助者,就像过去捕鲸船出去捕鲸的风险收益一样。 Seth Davies 不愿透露自己相关部署的具体细节,但他承认,这次比赛他交的入场费里面来自他本人的钱不到一半。即便如此,在第一天被淘汰后,他又交了 250000 美元再度入场,所以他自己出的钱已经“达到了大六位数”。

超级豪客赛进入第三天,也就是最后一天时,剩下的五名玩家从亚马逊房比较破旧的外围赌桌转移到了带电视转播的内场。上方耀眼的舞台灯让牌桌的绿色毛毡也泛起了点点微光, 为了拿得到最佳的拍摄角度,45 英尺的摄像机吊臂不时地左右摆动。一路走到这一步的所有五名玩家这一次赚钱是没问题的了,但究竟能赚多少钱要取决于在派彩阶梯上他们还能爬多高。随着比赛的开始,筹码最多的人,27 岁的西班牙职业选手 Adrián Mateos,用一连串稳定的巨额赌注对其他玩家保持着高压态势,他一次又一次地询问对手是不是想孤注一掷,或者要不宁愿弃牌,等待另外一两个玩家被淘汰掉,这样就可以拿到第四名或第三名而不是第五名,从而多拿 30 万美元或 70 万美元的奖金。

类似这样的情况会以奇怪的方式扭曲玩家剩余筹码的价值,具体怎么扭曲要取决于他们处在什么位置。如果在你弃牌之后另一位玩家被淘汰出局,那么就算你只剩下一个筹码也可能价值连城。也有 solver 可以模拟这些情况,但是随着筹码相对于盲注越来越小,而且要求玩家在每手牌开始前都要投入底池,光靠完美玩法已不足以真正保证你能获胜了,游戏往往基本上变成抛硬币猜正反面。 Davies 说:“归根结底,你最终要比的还是抛硬币,价值百万美元的抛硬币游戏,然后你希望自己能获胜。”

在一位竞争对手被淘汰后,戴维斯发现自己的筹码最小。在他身后只剩下一个人的情况下,他决定拿手上的梅花 A 与7 赌一把,筹码全押,正如 solver 的建议那样,考虑到他手上的筹码量,他应该这么做。剩下的玩家,留一头马尾辫的英国人 Ben Heath,很快跟注,并翻出了一对 J ,让他成为有 67% 的概率赢得这手牌的热门人选。庄家摆出的五张牌都没能改善 Davies 的赢面,所以 Heath 赢下了底池,Davies 被淘汰,拿到第四名。他从赌桌旁站了起来,收拾好背包,戴上 N95 口罩,离开了赛场。他告诉我说:“那算是一场豪赌了。”但当 Davies 知道自己过去三天的比赛玩法跟家里电脑生成的最优策略是如何的接近时,至少这一点他是满意的。(另一个安慰是他拿到了第四名的奖金 930791 美元。)

把兑现券放在兜里之后,Davies 又走到附近一场已经开始的锦标赛,花了50000 美元入场。他本来打算在买入之前先吃点晚饭休息一下,但在看到来这里比赛的都是什么人(很多人看起来很有可能不会采取最优策略比赛)之后,他改变了主意。Davies 说:“这 5 万块钱看起来不可思议。我完全没法接受自己不入场试试。”

AI 的介入让扑克比赛的格局发生了改变。对于这种改变,跟我交谈过的玩家不是个个都感到高兴。一方面,尽管对于当今大多数赌注较小的比赛来说,所采用的策略看起来跟 slover 出现之前采用的策略非常相似,但赌注较高的竞争已经变得更加激烈。随着最优策略被更多的人了解,顶级玩家曾经相对于相当优秀玩家在技术上的优势已经大大缩小。但在 Doug Polk(在赢了数千万美元后,他已经在 2017 年已经基本上退出了扑克这个行当)看来,slover 所做出的改变事关扑克存亡。Polk 说: “我觉得这在一定程度上扼杀了这种游戏的灵魂,”把玩牌的人“从最有创造力的问题解决者,变成了能够记住最多东西并能应用起来的人。”

PioSOLVER 背后的开发者 Piotrek Lopusiewicz 反驳说,新一代的人工智能工具只是扑克技术更漫长的创新模式的延续。在 solver 出现之前,像 Polk 这样的顶级在线玩家就使用了软件来收集有关对手历史比赛的数据,并分析对方的潜在弱点。Lopusiewicz 说:“所以现在的情况是有人在一场军备竞赛里面带来了火力更强的武器,突然之间,那帮赚不了钱的家伙的态度就变成:‘呃,好吧,但我们其实不想要那种军备竞赛。我们只想要我们的工具,而不是更好的工具。’”

此外,在 Lopusiewicz 看来,slover 其实并没有改变了扑克,而是揭示了它的本质。不管扑克玩家自己有没有意识到,或者想不想知道,这种游戏的核心始终都是约翰·冯·诺依曼所揭示的最大化问题。Lopusiewicz 说:“时至今日,但凡到了一定水平的人都得尊重扑克的数学那一面,他们再也不能视而不见了。”

译者:boxi

相关推荐

“赌神”的武器:人工智能是如何征服扑克游戏的(三)
“赌神”的武器:人工智能是如何征服扑克游戏的(二)
“赌神”的武器:人工智能是如何征服扑克游戏的(一)
AI玩麻将,6人德州扑克成新赌神?
AI赌神超进化:德扑六人局击溃世界冠军
第三代AI赌神:在六人桌德扑中胜过5个人类顶尖高手
SLG大战中的腾讯游戏:武器很多,纠结不少
36氪领读 | 人生如何高效决策?“扑克女王”教你“6步决策法”
浙大提出会打德扑的“自我博弈”AI,还会玩射击游戏
起底货拉拉老板周胜馥:做过职业赌徒,曾靠年轻女员工招揽司机

网址: “赌神”的武器:人工智能是如何征服扑克游戏的(三) http://m.xishuta.com/newsview63699.html

所属分类:人工智能