计算机是完美的扑克玩家?业界

爱范儿 / 积木 / 2015-01-11 08:44
在人类与计算机的智力较量中,计算机貌似又胜了一局。在《科学》杂志发布的一篇论文中,计算机科学家宣称,他们设计的程序 Cepheus 是接近完美的扑克玩家。在双人限注德州...
Poker chips piled high

 

在人类与计算机的智力较量中,计算机貌似又胜了一局。在《科学》杂志发布的一篇论文中,计算机科学家宣称,他们设计的程序 Cepheus 是接近完美的扑克玩家。在双人限注德州扑克游戏中,它的策略如此完美,以致于人类玩家终其一生也无法战胜它。这并不是说 Cepheus 一局也不会输,但是从长期来看,结果只能是平手,或者计算机获胜。

计算机科学家对 Cepheus 的训练时间是 70 天,使用了 200 台计算机。所有的计算机都配置了 24 个处理器 和 32GB 的内存。在训练结束后,Cepheus 的表现接近完美。“我们可以继续训练它,而它也可以变得越来越好,” 参与此项研究的计算机科学家 Michael Bowling 对 The Verge 网站 说,“但是我们停止了训练,因为我们已经看不出它的缺点所在了。”

在扑克游戏中战胜人类,是计算机取得的又一个成就。以前,计算机在棋类游戏中取得过胜利,但是,扑克游戏更难把握。与棋类游戏相比,扑克游戏中的玩家无法掌握全部信息。“完全信息博弈,比如国际象棋,当你做决策时,所需的全部信息都在棋盘上,但是,扑克游戏是不同的,它是‘不完全信息博弈’。” Bowling 说。在扑克游戏中,策略的制定更为困难。

不过,Cepheus 真的那么完美么?在与 Cepheus 对战 400 局之后,卫报扑克专栏的自由撰稿人 Christopher Hall 发现 Cepheus 的弱点,那就是缺乏适应性。在德州扑克中,最重要的是找出对方的弱点所在,然后无情地利用这个弱点,直到对手改变风格。那是取得胜利最快、最聪明的方式。一开始,Christopher 一直被计算机的进攻压制,所有的诈唬都失败了。为了对抗计算机,他开始改变策略,在翻牌前变得更有进攻性,并且完全停止了诈唬。这时候,计算机并没有做出相应的调整。

最终,在 400 局的对抗中,Christopher 设法获得了更多胜利。不过,他也认为,这仍然是很小的样本,无法从中得出确定结论。“或许最好的方法是,让 Cepheus 与世界级的专业选手对抗,证明它的确是难以战胜的选手。这就像是深蓝与卡斯帕罗夫对抗一样,肯定会让我这样的扑克爱好者充满兴趣。当然,我仍然认为人类选手会获胜。” 他表示说。



1. 遵循行业规范,任何转载的稿件都会明确标注作者和来源;2. 的原创文章,请转载时务必注明文章作者和"来源: ",不尊重原创的行为 或将追究责任;3.作者投稿可能会经 编辑修改或补充。


阅读延展

1
3
Baidu
map