一个无与伦比的计算机程序终于解决了两人极限德州扑克

根据《今日科学》上发表的一项研究,两人极限德州扑克终于解决了。科学家设计了一个名为Cepheus的电脑程序,其游戏策略近乎完美,统计分析显示,即使人类扑克玩家与电脑竞争了一辈子,也无法打败它。这意味着,无论游戏如何开始,电脑将赢得或收支平衡,从长远来看-使它基本上是无敌的。...

根据《今日科学》上发表的一项研究,两人极限德州扑克终于解决了。科学家设计了一个名为Cepheus的电脑程序,其游戏策略近乎完美,统计分析显示,即使人类扑克玩家与电脑竞争了一辈子,也无法打败它。这意味着,无论游戏如何开始,电脑将赢得或收支平衡,从长远来看-使它基本上是无敌的。

006ny77Vgy1gqlgr6xagpj35og3sg7wy

从长远来看,这基本上是无敌的

阿尔伯塔大学计算机科学家、该研究的合著者迈克尔·保林说:“我们不是说,这是保证一手就能赢钱的。”我们所说的是,从长远来看,如果你看所有可能发生的手,你平均所有这些,那么计算机就不能以失败的速度输掉——它必须是收支平衡,要么是赢。”

解决像扑克这样的游戏是一个巨大的计算成就(解决一个游戏本质上意味着设计一个不能长时间丢失的程序。)简单的游戏,比如tic-tac-toe,很容易解决。大多数人最终掌握了如何赢得或画一个游戏的井字游戏简单地玩了几次。但其他的游戏要难得多。象棋和跳棋是复杂的,提供了成千上万种可能的情况下,计算机必须作出反应。然而,即使是那些游戏也没有扑克那么难解决,因为在扑克中,你没有所有的信息——你不知道你的对手拿着什么牌。”完美的信息游戏,如国际象棋或跳棋,是所有你需要做决定的信息都存储在棋盘上的游戏。但扑克不是这样的;这是一场“不完美的信息游戏”,这使得制定战略变得更加困难。

培训阶段涉及200台计算机

这个程序的工作方式其实很简单:在游戏过程中,它所要做的就是搜索预先计算好的游戏场景的数据库,在任何给定的时刻找到最佳的移动方式。然而,建立这个数据库绝非易事。”艾伯塔大学的计算机科学家、这项研究的合著者迈克尔·约翰森解释说:“我们在这个训练阶段,这个程序一开始就对自己进行统一随机的比赛,这意味着“除了遵守游戏规则之外,它根本不知道自己在做什么。”。但随着电脑的自我发挥,它变得更好,并更新了自己的策略。

一个无与伦比的计算机程序终于解决了两人极限德州扑克

马库斯·斯皮斯克

Bowling解释说:“它是通过考虑所有可能的决策点,以及(可能从这些点发生的)每一个可能的行动来实现的。”。例如,程序可能会想:“如果我在这里筹集资金,而不是随机玩,我会赢多少钱或少多少钱?”如果它决定随机玩,并且输钱,那么它会返回并计算如果它募集资金,它会赢多少钱。他说,这一数额随后被存储为后悔值因此,它计算出每一个动作的后悔数,每一个做出决定的地方的后悔数。“所以,每当它玩一手牌时,程序就会改变它的策略,这样它就开始更频繁地做它在过去的游戏中后悔没有做的事。而且,随着它的更新,仙王座最终接近保龄球所谓的“完美发挥”

“我们在这一点上停了下来,因为我们分不清完美与否。”

约翰森说,训练阶段花了70天,由200台计算机组成,每台计算机配备32GB内存和24个中央处理器。在那70天结束时,仙王座的比赛近乎完美。”我们可以继续训练它,它会继续变得更好但我们在这一点上停了下来,因为我们分不清它和完美。“即使这个项目花了一辈子的时间在培训上,他说,让它更接近完美真的没有多大的价值-“除了学术上的新奇。”简言之,进一步训练仙王座并不会改变这个项目的成功程度。

仙王爷也能证明,在任何一张牌发出去之前,发牌的人,因此排在第二位的人,比其他人有微小的优势。”“事实上,我们现在可以证明,庄家有一个优势,我们称之为'88 millablinds'每场比赛,”约翰森说这是每场比赛0.088个大瞎子。”

“据我所知,这是迄今为止基本上解决的最大的不完美信息游戏,”卡内基梅隆大学的计算机科学家Tuomas Sandholm在《今日科学》上发表的一篇关于这项研究的新闻报道中说,他没有参与这项研究。这也是“第一个由人类参与竞争的游戏,现在已经基本解决了。”

11年的扑克生涯

保龄球是一个研究小组的一部分,该小组于2003年首次开始研究扑克项目的想法。当时,他说,创造一个能解决两人游戏的程序是他们最不想做的事情我不认为任何人梦想我们能解决这个游戏。“相反,他们致力于开发一个程序,可以击败顶级玩家在平头极限扑克,”最简单的扑克游戏人类玩,”保林说。2008年,他们取得了成功。一年前,这个名为“北极星”的项目输给了职业选手菲尔·拉克和阿里·伊斯拉米,但研究人员改进后,它在六场比赛中赢了三场,还打了一场平手。

“实际上,我们在它身上植入了一些适应素质,这样它就可以利用人类的弱点,”保林说——这是仙王座没有做到的,因为它试图发挥完美,从而避免了不得不适应对手。

“最大的不完美信息游戏基本上解决了至今。”

在北极星击败顶尖选手后,保龄球和他的团队不得不决定下一步该做什么。他们是不是要解决两人的限制,一个更复杂的游戏?”有人做了一个信封背面的计算,结果表明,我们需要4 PB的磁盘空间[1000000 GB],只是写下解决方案后,我们解决了游戏,”保林说当时,我说,‘好吧,我想我们那时解决不了,那我们继续吧。’但他的团队中的其他研究人员坚持说;毕竟,购买PB级磁盘是可能的。

最终,解决游戏不需要4 PB的磁盘空间。”“我们在这一过程中学到了一些东西,”鲍林说,“比如你可以把所有的红心和黑桃都换成套装,”他说,这使得它们的容量降到了520兆字节。他们还研究了如何压缩数据,以便程序能够快速访问策略。”“有很多这样的技术平衡行为,”保林说如果比赛规模再大一点,速度再慢一点,我们可能就没法成功。”

现在,研究人员已经解决了两人极限德州扑克,他们想在其他形式的扑克工作,如头部无限制扑克。游戏的挑战意味着他们可能无法解决它,但他们可能能够**出一个可以击败世界上最好的人类玩家的程序。三人游戏的情况也是如此。“三人游戏中没有任何策略可以保证它不会输,因为游戏中的其他两个玩家可能会联手。”在竞争***中,合谋是非法的,但很难量化这到底意味着什么,保龄球说。有些人甚至没有意识到就这样做了。不过,他说,当他们用另外两台电脑测试仙王座时,似乎产生了很好的策略。”我们只是不能说它是否能产生最佳的策略,”保林说。

它可以帮助**或公司优化其安全战略

仙王座最终可能做的远不止打扑克。Bowling说,研究人员已经在考虑如何帮助**或公司优化他们的安全策略,使之成为“不可开发的”。例如,仙王座可以安排巡逻或检查站,以挫败试图利用防御策略的对手。这个项目也可以用来帮助医生调整糖尿病患者的治疗方法。如果他们的饮食或活动水平发生变化,程序可以计算出最佳反应,同时考虑到任何数量的不确定性。

“我对这一切很感兴趣,”鲍林说也许是因为我们达到了这个里程碑,我真的很想看到他们有扑克以外的应用程序空间。“当然,保龄球的愿望,从游戏中转移可能与他的扑克意见有关。”“我没有耐心打扑克,”他说我其实觉得有点无聊。“这位计算机科学家去年只玩过一次扑克。”在过去的12个月里,我唯一一次玩扑克是在测试我们当前程序的界面时我玩了大约一百手。”

要查看仙王座的战略或与之对抗,请单击此处。

  • 发表于 2021-04-28 14:50
  • 阅读 ( 153 )
  • 分类:互联网

你可能感兴趣的文章

苹果发布了一款免费的德州hold'em游戏

苹果重新发布了iOS版的德州Hold'em游戏。新版本增加了改进的视觉效果、新的字符和对更大屏幕的支持。最好的是德州Hold'em现在完全可以免费玩了,而且没有应用内购买。使它成为稀有的野兽。 ...

  • 发布于 2021-03-20 05:10
  • 阅读 ( 165 )

hbomax终于来到了亚马逊fire电视设备公司

...应用程序中注册HBO Max。 “我们的持续目标是使HBOMax及其无与伦比的内容能够在所有他们喜爱的设备上为客户提供,”WarneMedia的销售和分销主管TonyGoncalves在新闻稿中说。“Fire TV是客户的最爱,我们期待着与亚马逊团队合作,通...

  • 发布于 2021-04-17 08:25
  • 阅读 ( 189 )

《运动员的复仇:体育入侵德州科技乌托邦》

...历克斯·布拉格(Alex Blagg)说,典型的西南偏南出席者是一个“穿酷衣服的人”,戴着“甜美的胡子和眼镜”,“有很多拉链和皮带的花哨外套”,还有一个“装满电池的黑色背包”。换句话说:时髦的人遇到了极客。
 尽管...

  • 发布于 2021-04-25 12:23
  • 阅读 ( 158 )

补救的期待已久的量子突破终于有一个发布日期

...承诺提升到另一个层次。
 游戏复杂的核心概念仍然是无与伦比的
 这款游戏最初的承诺是雄心勃勃。当《量子断裂》在2013年首次被详细描述时,据说它关注的是两个可玩的角色,这两个角色都被一个失败的大学实验授予...

  • 发布于 2021-05-01 00:12
  • 阅读 ( 135 )

宾利的情感阅读应用程序告诉无情的亿万富翁该买哪辆车

...注册的——然后被告知,因为我的感官被驾驭完美海浪的无与伦比的**和纯粹的美丽唤醒了(视频中有一段冲浪的片段),我真正需要的是我的汽车座椅是“亚麻布和布鲁内尔分裂。”当然!我的情绪骚动终于结束了!
 不管...

  • 发布于 2021-05-01 20:53
  • 阅读 ( 118 )

即使你下棋很差,下棋也很有趣

去年夏天,游戏设计师扎克·盖奇(Zach Gage)和一个朋友去散步,最终讨论转向国际象棋。扎克·盖奇以《魔塔》(Spelltower)和《可笑的钓鱼》(Rissic FIshing)等****而闻名。他的朋友最近开始玩这个游戏,变得相当熟练,而盖奇...

  • 发布于 2021-05-08 04:39
  • 阅读 ( 140 )

观看一台人工智能超级计算机在20万美元的扑克锦标赛中与顶级职业选手较量

...被训练成玩无限制德州扑克(1对1)。这个系统是在超级计算机上运行的,而人类是在***上运行的。不管怎样,人类职业选手都可以拿回家20万美元,根据他们的表现在四重奏中分配。但是,如果人工智能(名为libertus)超越了他...

  • 发布于 2021-05-09 10:39
  • 阅读 ( 104 )

如何在windows10中解锁微软的免费图形计算器

...积分课,但我仍然认为微软终于给了优秀的Windows计算器一个极客的提振,这真是太棒了。如果你认为“科学”模式很有趣,那么你还没有看到任何东西即将面世,windows10是一个成熟的图形计算器。我开玩笑,但只有一点点,因...

  • 发布于 2021-05-13 06:38
  • 阅读 ( 211 )

从eset获得无与伦比的网络安全培训,并扮演代理surefire赢得平板电脑

为了维护一台高性能的计算机,仅仅安装网络安全程序是不够的。你还必须了解所有的安全浏览实践。所以ESET提供了两种方法,数一数,两种方法,让你在网络安全方面得到全面的培训。首先,ESET的软件套件Smart Secu...

  • 发布于 2021-05-27 14:28
  • 阅读 ( 109 )

harmonix的dropmix是一款奇怪但有趣的音乐混搭纸牌游戏

...能的游戏板、NFC扑克牌和移动应用程序的体验,可以创建一个有趣的音乐混搭工具。这是令人惊讶的乐趣-虽然对大多数人来说,它可能不会有持久的吸引力,使99.99美元的入门价格值得。 Dropmix的核心是board,board是一...

  • 发布于 2021-05-29 21:12
  • 阅读 ( 98 )
BL6581526
BL6581526

0 篇文章

相关推荐