微软麻将AI超越人类后,研究团队要出教材提升人类牌技

 人工智能解决方案     |      2020-04-13 10:57

导读:未来人类可能不得不依靠人工智能来提高他们的麻将技能。在微软亚洲研究院开发的麻将人工智能系统Suphx在国际知名的专业麻将平台天丰上排名上升到10位,超过99.99%的人之后,该

未来人类可能不得不依靠人工智能来提高他们的麻将技能。

在微软亚洲研究院开发的麻将人工智能系统Suphx在国际知名的专业麻将平台天丰上排名上升到10位,超过99.99%的人之后,该研究团队在接受澎湃新闻(www.thepaper.cn)采访时表示,日本出版社有兴趣联系Suphx,并计划编写一本由Suphx玩牌的书。如果你对麻将感兴趣,你可以通过这本书学习如何打麻将。

4月9日,微软亚洲研究院Suphx研发团队通过在线直播详细介绍了Suphx的技术细节。它的论文最近在arXiv平台上发布。直播结束后,微软亚洲首席研究员秦涛和微软亚洲高级研究工程师黎俊杰在接受澎湃新闻采访时表示,该团队目前正在与天丰平台进行谈判,看是否会考虑引入类似服务来提高人工许可技能。例如,通过输入一个人当前的牌面,Suphx将告诉这个人该玩哪张牌以及为什么。

有趣的是,根据两位研究人员的说法,一家日本出版社正在联系,希望Suphx能起草一本书。因为有些麻将爱好者称超级麻将为教科书和超级麻将老师,如果学生对麻将感兴趣,他们可以通过这本书学习打麻将

Suphx如何提高其卡片技能

去年8月,微软亚洲研究院在世界人工智能大会上正式宣布,其麻将人工智能系统Suphx成为首个在国际知名的专业麻将平台天丰上升级到10级的人工智能系统。

在过去的六个月里,研究小组再次调整了Suphx。具体来说,首先是重新优化整个系统架构,使其更快更好。另一个是算法也得到了改进,比如“先知教练”。从博弈论的角度来看,麻将是一种多玩家的不完全信息游戏。麻将总共有136张牌。每个玩家只能看到几张牌,包括他的13张牌和每个人玩的牌。更多的牌是看不见的,包括其他三个玩家的牌和墙壁牌。面对如此多隐藏和未知的信息,麻将玩家很难根据自己的手做出一个好的决定。

但是通过先知教练,Suphx可以看到所有的信息,包括(1)玩家自己的私人牌,(2)所有玩家的公共牌,(3)其他公共信息,(4)其他三个玩家的私人牌,以及(5)墙壁牌。普通玩家只能获得(1)(2)和(3),而(4)和(5)是只有“先知”才能获得的附加“完美”信息。

在Suphx,Suphx研发团队首先利用包括完美信息在内的所有功能,对“先知”进行强化学习培训。在这一步,“先知”的学习进度是受控的,不能太强。然后,通过给完美的特征加上面具,“先知”逐渐过渡到正常的人工智能。然后,继续训练正常的人工智能,并进行一定次数的迭代,利用衰减学习率和拒绝采样技术调整训练过程,使人工智能技术能够不断完善。


  • 共2页:
  • 上一页
  • 1
  • 2
  • 下一页