DeepMind提出多人游戏景观的图论研究

2020-11-07 11:02:33

20世纪60年代中期,计算机科学和人工智能研究人员为国际象棋游戏取了一个绰号“果蝇”--指的是基因研究中常用的果蝇。美国进化生物学家托马斯·摩根通过研究他著名的“苍蝇房”为这一领域做出了重要贡献,如今人工智能研究人员相信,像国际象棋这样的多人游戏可以提供类似的可访问和相对简单的实验环境,以形成关于复杂系统的有用知识。近年来,研究人员将多人游戏作为人工智能研究的热门试验台,使用强化学习技术在国际象棋、围棋、星际争霸II等游戏中创建超人代理。最近发表在《自然通讯》(Nature Communications)上的一篇论文《多人游戏的景观导航》(Naviating The Landscape Of Multiperer Games)指出:“然而,通过对游戏及其拓扑结构的描述,可以更好地了解这一进展。”在这项工作中,DeepMind和Lisboa大学的研究人员介绍了一个基于图形的工具包,用于分析和比较这方面的游戏。

理解和分解游戏的特征特征可以通过课程学习对代理进行下游培训,目的是使代理能够学习越来越复杂的任务。研究人员表示,确定一个能够对复杂的人工智能任务进行分类、表征和分解的框架变得越来越重要,他们转向多人游戏作为参考。他们将核心挑战定义为问题问题:“产生大量有趣的适应性环境来支持研究的工程问题。”研究人员从一个基本问题开始:是什么让游戏变得足够有趣,让人工智能特工学会玩?他们提出,要回答这个问题,需要能够刻画游戏拓扑结构并使其能够被发现的技术,“无论它们是否有趣”。该团队将图论和博弈论结合起来,分析了一般和多人游戏的结构。他们使用新的工具包来描述游戏,首先观察具有明确结构的激励性例子和规范游戏,然后扩展到更大规模的经验性游戏数据集。这些游戏的图表表现形式可以为研究人员提供各种洞察力,比如2016年击败围棋大师李世石的DeepMind程序AlphaGo中揭示的强传递关系。

这项研究调查了游戏的情况,并开发了一些技术,以帮助理解游戏的空间,在游戏设置中对代理进行下游培训,以及提高兴趣的算法开发。该团队表示,这项工作为进一步探索基于图形的游戏分析的理论属性以及问题问题和任务理论开辟了道路,并有助于游戏几何和结构的相关研究。

我们知道你不想错过任何新闻或研究突破。订阅我们广受欢迎的时事通讯《同步全球AI周刊》,获取每周AI更新。

想为同步评论做贡献吗?Synced的新专栏Share My Research欢迎学者与全球AI爱好者分享他们自己的研究突破。