他们先来下棋,现在来玩电子游戏。在21世纪,一大群人工智能竞争者很可能主宰人类玩的每一块棋盘、屏幕和控制台。像深蓝和Alpha Go这样的著名机器已经征服了世界上一些最复杂的战略难题。
日本科技巨头索尼(Sony)周三透露,它已经为赛车模拟器Gran Turismo训练了有史以来最强大的对手。Gran Turismo是一款可以在自己的比赛中击败顶级电子竞技车手的冠军。AI racer机器人是在1000多台PlayStation 4游戏机的战场上打造而成的,它已经变得足够聪明,能够识别最佳路线,并能够执行熟练的战术机动来超越或阻挡竞争对手,即使是在车辆拥挤的情况下。索尼声称,它在这样做的同时,仍然尊重游戏中的人类礼仪。
该公司本周在《自然》杂志上发表了关于其名为Gran Turismo Sophy的创意产品的研究。报告称,开发过程将“最先进、无模型、深度强化学习算法与混合场景训练相结合,以学习一种综合控制策略,该策略将卓越的速度与令人印象深刻的战术结合起来。”。“此外,我们还构建了一个奖励函数,使代理人能够在遵守比赛重要但不违反规定的体育道德规则的同时保持竞争力。”
在一次媒体播放的演示中,索菲在迎头比赛中击败了四名世界顶级赛车手,证明了这项技术相对于普通人的优越性。但索菲的愿望是永远不要粉碎人类的精神,或让它感到失败。相反,这是为了在电子竞技中激发新的激情,尤其是在那些认为自己没有什么挑战可以应对的精英球员中。
“我感到沮丧,这在与人工智能作战之前从未发生过,”四名赛车手之一山中智明在失利后说。“我开车的时候就像是要撞上一个人。这真是一件了不起的事情。”
从这个意义上说,索菲突破了人类的极限;索尼人工智能(Sony AI)首席执行官北野博明(Hiroaki Kitano)在一份声明中表示,它可以“将玩家的技术和创造力提升到一个新的水平。”。该公司表示,正在探索将Sophy整合到Gran Turismo未来版本中的方法(该游戏的第七版将于3月发布)。
Gran Turismo现在加入了一长串人工智能击败人类的游戏,包括shogi、Go、星际争霸、经典的Atari视频游戏,以及多人系列《古代防御》,微软支持的OpenAI为这些游戏创建了一个战斗机器人。
但Gran Turismo比其他游戏机更复杂,要求玩家平衡摩擦物理和空气动力学,同时做出瞬间判断,并通过光速反射对不断变化的地形做出反应。除此之外,专家们还表示,Sophy的成就突出表现在其行为具有攻击性,但仍然公平,并遵守玩家的行为准则,而不仅仅是法律条文,换句话说,体现了人类性格的微妙差别。
虽然从技术上讲是合法的,但索尼不希望Sophy在赛道上欺负其他赛车手而获胜。为了确保它不会这样做,他们通过对与其他司机的碰撞施加惩罚来训练它的神经网络,例如使用一种称为强化学习的试错过程。
“特工应该是朋友、同志、人类的伙伴,人们可以同情的特工,”Gran Turismo的创始人山内和弘(Kazunori Yamauchi)说。“此外,代理人可以激发人们的情绪,使代理人和人类能够相互尊重。”