索尼把人工智能训练得如此擅长Gran Turismo,以至于它开始像个混蛋一样开车

2022-02-13 18:15:38

如果你想真正擅长某件事,你就要尽可能频繁地做,尽可能长时间地做,一点一点地取得进展,直到达到你想要的结果。训练人工智能模型并没有太大的不同,这基本上就是科技巨头索尼人工智能研究部门的一个团队在Gran Turismo教其代理人Sophy成为世界上速度最快的人的方式。和人类一样,索菲在GT的表现越好,它就越是一个混蛋。

Sophy是PlayStation人索尼(Sony)和Gran Turismo开发者Polyphony Digital的合作项目。(“那么phy”-明白了吗?)Sophy真的很快,但不像马里奥卡丁车中的“AI”,它不快是因为它作弊。它的游戏规则与人类玩家相同,使用的工具也相同。不同之处在于,它通过在索尼云计算的PS4网络上运行数千次而变得优秀,同时根据其行为的结果得到积极或消极的强化。

Sophy的技能随着时间的推移而发展,正如你在下面嵌入的视频制作中所看到的那样。我向你保证,这真的很有趣。如果你和我一样,每当有人在耳边提到“人工智能”或“机器学习”这个词时,你的眼睛就会变得呆滞,你会感到头晕。但索菲的案例真的很有趣,因为它是如何发展到今天的。

例如,Polyphony Digital的一位工程师说,索尼人工智能团队第一次把Sophy带到工作室与真人比赛时,虽然速度很快,但确实很混乱。它不能直线行驶。

然后,它又回到了绘图板上,发展核心竞争力,直到它比世界顶级FIA Gran Turismo锦标赛选手更快,尽管只是在热身圈。研究人员将Sophy带回复调,并让一个由四辆Sophy控制的汽车组成的团队与四名专业的人类驾驶员进行对决。索菲队在三场比赛中的两场比赛中获得第一名,但总体得分低于身体温暖的队伍,因此放弃了比赛。

问题是,索菲学会了如何快速驾驶,但它不知道如何快速驾驶而不像个十足的傻瓜。索尼人工智能(Sony AI)董事兼项目负责人彼得·沃尔曼(Peter Wurman)说:“我认为我们都低估了正确对待体育道德的难度,[教Sophy]在面对竞争对手时不要过于咄逼人或过于胆小。”切换到Sophy在龙径海滨的第一个弯道上,一对对手刹车太迟,在赛道上用双轮滑行的片段。

一旦索菲不再做那些让它看起来很糟糕的事情,它在交通中的速度几乎和它独自使用沥青时一样快。从这种新发现的超人直觉中,它所使用的一些非常规技术变得显而易见。Gran Turismo制作人兼复调数字总监山内和弘(Kazunori Yamauchi)介绍了Sophy在GTPlanet上独特驾驶的一个例子:

“我是一名赛车手,学会了如何快速驾驶的技巧,比如慢进快出,”Gran Turismo的创始人山内和弘(Kazunori Yamauchi)说。“Gran Turismo Sophy不是这样学习的。我认为Sophy进入世界后,关于驾驶的教科书将不得不改变。例如,当Sophy进入弯道时,它实际上会转弯并刹车。通常,当你进入弯道时,负载只在两个前轮胎上,但Sophy的负载在三个轮胎上:两个在前轮胎上nt和一个在后面。它允许汽车在转弯时发生断裂,而按照惯例,人类是无法做到这一点的。最终会发生的是,它正在快速进入,快速离开。"

我认为,在Gran Turismo中,Sophy的一些技巧可能不会在一辆真正的汽车上得到很好的效果。尽管如此,Sophy对这项运动的理解和理念与世界上最好的球员不同,因此,他记录的圈数比他们快半秒到1.5秒。例如,它在龙径臭名昭著的“死亡奇卡”上穿针的方式,需要一定程度的精确性和勇气——除了世界上最好的车手之外,其他车手都能做到——即使是他们也可能不会始终如一地成功。

据推测,复调数字将在发布后的更新中以某种方式将Sophy带到Gran Turismo 7上——不仅作为竞争对手,还可能作为一名驾驶教练。就我个人而言,我认为GT7可以使用具有快速双手和体面赛车的人工智能,因为这是GT的计算机控制对手从未拥有过的东西。我会很高兴有一个淡化版,只是普通的快速;将galaxy brain fast版本留给专业人士。