国际象棋以冷酷的逻辑著称,但弗拉基米尔·克拉姆尼克(Vladimir Kramnik)因其美丽而热爱这项运动。
“这是一种创造,”他说。他对棋盘上思想冲突的艺术性的热情,交易复杂但优雅的挑衅和柜台,帮助他在2000年推翻了加里·卡斯帕罗夫(Garry Kasparov),并作为世界冠军度过了几年。
然而,去年从竞技国际象棋中退役的克拉姆尼克也认为,他心爱的游戏已经变得不那么有创造力了。他部分归咎于电脑,电脑毫无灵魂的计算产生了大量的开口和防守,顶级球员都是死记硬背的。克拉姆尼克说:“对于相当多的最高级别的游戏来说,一半的游戏--有时是完整的游戏--都是出于记忆而玩的。”“你甚至不玩你自己的准备游戏;你玩你电脑的准备游戏。”
周三,克拉姆尼克提出了一些想法,如何在一个违反直觉的来源-世界上最强大的国际象棋计算机-的帮助下,将一些人类艺术恢复到国际象棋中。他与Alphabet人工智能实验室DeepMind合作,该实验室的研究人员挑战他们的超人游戏软件AlphaZero,学习九种国际象棋变体,这些变体被选中,以激励棋手进入创造性的新模式。
2017年,AlphaZero展示了它可以自学在国际象棋、围棋或日本围棋中全面击败最好的电脑棋手。Kramnik表示,如果人们愿意对既定规则进行一些小的改变,其最新结果显示出有待探索的诱人的国际象棋新前景。
该项目还展示了一种更具协作性的模式,用于棋手和机器之间的关系。参与该项目的深度思维研究人员Nenad TomašEV说:“国际象棋引擎最初是用来对抗人类的,目的是击败人类。”“现在我们看到,像AlphaZero这样的系统被用来与人类一起进行创造性探索,而不是与他们对立。”
人们下国际象棋已经有大约1500年的历史了,规则的调整并不是什么新鲜事。也没有抱怨电脑让游戏变得无聊。
大约500年前,当欧洲棋手将一个移动缓慢的棋子提升到强大的现代女王中后,国际象棋迅速传播开来,使这项游戏变得更加快捷。1996年,在IBM的深蓝击败卡斯帕罗夫的前一年,国际象棋神童出身的逃犯鲍比·费舍尔(Bobby Fischer)在布宜诺斯艾利斯召开了一次新闻发布会,抱怨国际象棋需要重新设计,以降低计算机增强的记忆力,鼓励创造力。他推出了费舍尔随机国际象棋(Fischer Random国际象棋),它保留了通常的游戏规则,但将每局棋盘后面强大棋子的起始位置随机化。费舍尔·兰登(Fischer Random),也被称为国际象棋960,慢慢地在国际象棋界赢得了一席之地,现在有了自己的锦标赛。
DeepMind和Kramnik利用AlphaZero从头开始学习游戏的能力,比人类几十年或几个世纪的游戏更快地探索新的变体,从而揭示它们的美丽和缺陷。TomašEV说:“你不会想花很多个月或几年的时间来尝试玩什么东西,结果却意识到,‘哦,这不是一款漂亮的游戏。’”
AlphaZero是AlphaGo更灵活、更强大的继任者,AlphaGo在2016年击败围棋冠军,在人工智能历史上奠定了一个里程碑。它开始学习一种只有规则、计分方式和预先设定的尝试和取胜冲动的游戏。该项目的另一位DeepMind研究员乌尔里希·帕奎特(Ulrich Paquet)说:“当它开始播放时,它太糟糕了,我想躲在我的桌子下面。”“但是看到它从虚无中进化出来是令人兴奋的,而且几乎是纯粹的。”
在国际象棋中,AlphaZero最初并不知道它可以拿下对手的棋子。经过几个小时的高速对战,它变得更加熟练,对一些人来说,比起以前的国际象棋引擎,它变得更加自然。在这个过程中,它重新发现了几个世纪以来人类国际象棋中的想法,并增加了自己的才华。英国特级大师马修·萨德勒(Matthew Sadler)形容,研究AlphaZero的游戏就像“发现了过去某个伟大玩家的秘密笔记本”。
AlphaZero测试的九种国际象棋替代方案包括无掷石国际象棋,克拉姆尼克和其他人已经在考虑这一点,并在1月份举行了第一次专门的锦标赛。它取消了一种名为投掷的移动,这种移动允许玩家将他们的国王塞在由其他棋子组成的保护屏后面-强大的防御工事也可能令人窒息。其中五个变种改变了棋子的移动,包括鱼雷国际象棋,在整个游戏中,棋子可以一次移动两个方格,而不是只在第一步就移动。
阅读AlphaZero结果的一种方式是用冷数字。与传统规则相比,非掷王牌国际象棋中的平局不太常见。学习不同的规则改变了AlphaZero在不同棋子上的价值:在传统规则下,它对女王的估值为9.5卒;在鱼雷规则下,女王只值7.1卒。
DeepMind的研究人员最终更感兴趣的是对该项目中另一个伟大的国际象棋大脑克拉姆尼克(Kramnik)的分析。TomašEV说:“这不是数字的问题,而是人类坐下来玩耍在质量上、美学上是否令人愉悦的问题。”周三发布的一篇技术论文包括克拉姆尼克对AlphaZero探索的70多页评论。
克拉姆尼克在AlphaZero适应新规则的方式中看到了美丽的闪光。他说,禁止掷骰子的国际象棋激发了丰富的新模式,以确保国王的安全。事实证明,一种更极端的变化,即自捉式国际象棋,棋手可以拿走自己的棋子,甚至更具诱惑力。克拉姆尼克说,这条规则实际上给了球员更多的机会牺牲一块来取得领先,这一战术被认为是几个世纪以来优雅打法的标志。“总而言之,这只会让比赛变得更漂亮,”他说。
克拉姆尼克希望AlphaZero在外星人形式的国际象棋中的冒险能说服所有级别的棋手尝试。“这是我们给国际象棋世界的礼物,”他说。现在可能是个好时机。
曾两次获得美国国际象棋冠军的珍妮弗·沙哈德(Jennifer Shahade)表示,国际象棋多年来一直越来越受欢迎,但随着许多人寻求新的智力刺激,国际象棋经历了一场大流行。人们对国际象棋960的兴趣也在增长,这表明人们对新类型的游戏有兴趣,包括一些超级明星。本周晚些时候,沙哈德将为国际象棋960锦标赛提供解说,其中包括世界排名第一的马格努斯·卡尔森(Magnus Carlsen)和前冠军卡斯帕罗夫(Kasparov)。
像Kramnik一样,Shahade在AlphaZero测试的几个变种中看到了一些令人喜欢的东西,即使像允许棋子横向移动这样的变化让人感觉“精神错乱”。如果有什么牵引力的话,一些玩家仍然想依靠电脑和深入的研究来取得领先,但重新设置循环可能会让人着迷。美国国际象棋联合会(US Chess Federation)女子项目主任沙哈德(Shahade)说:“这些发现会让人感到新鲜--这可能会非常令人兴奋,并让一种不同类型的棋手受益。”
既然机器是不可战胜的,DeepMind和Kramnik的项目也可能鼓励计算机国际象棋变得更有创意。以色列巴伊兰大学(Bar-Ilan University)研究员伊莱·大卫(Eli David)表示:“与其让电脑国际象棋变得更强大,让人类一败涂地,我们可以专注于将国际象棋作为一种游戏形式的艺术。”他自己制造了由机器学习驱动的国际象棋引擎。他实验室的一名研究生正在开发国际象棋软件,该软件可以学习模仿特定棋手的风格,这使得询问机器在特定情况下最喜欢的特级大师过去或现在会做什么成为可能。
克拉姆尼克的经验表明,让人类与机器合作,而不是与机器对抗,可以扩展游戏的情感和技术体验。AlphaZero将他带到了即使是他广博的理解力之外的地方。“走了三步之后,你简直不知道该做什么,”他说。“感觉真好,就像你还是个孩子。”