索尼把人工智能训练得如此擅长Gran Turismo，以至于它开始像个混蛋一样开车

2022-02-13 18:15:38

如果你想真正擅长某件事，你就要尽可能频繁地做，尽可能长时间地做，一点一点地取得进展，直到达到你想要的结果。训练人工智能模型并没有太大的不同，这基本上就是科技巨头索尼人工智能研究部门的一个团队在Gran Turismo教其代理人Sophy成为世界上速度最快的人的方式。和人类一样，索菲在GT的表现越好，它就越是一个混蛋。

Sophy是PlayStation人索尼（Sony）和Gran Turismo开发者Polyphony Digital的合作项目。（“那么phy”-明白了吗？）Sophy真的很快，但不像马里奥卡丁车中的“AI”，它不快是因为它作弊。它的游戏规则与人类玩家相同，使用的工具也相同。不同之处在于，它通过在索尼云计算的PS4网络上运行数千次而变得优秀，同时根据其行为的结果得到积极或消极的强化。

Sophy的技能随着时间的推移而发展，正如你在下面嵌入的视频制作中所看到的那样。我向你保证，这真的很有趣。如果你和我一样，每当有人在耳边提到“人工智能”或“机器学习”这个词时，你的眼睛就会变得呆滞，你会感到头晕。但索菲的案例真的很有趣，因为它是如何发展到今天的。

例如，Polyphony Digital的一位工程师说，索尼人工智能团队第一次把Sophy带到工作室与真人比赛时，虽然速度很快，但确实很混乱。它不能直线行驶。

然后，它又回到了绘图板上，发展核心竞争力，直到它比世界顶级FIA Gran Turismo锦标赛选手更快，尽管只是在热身圈。研究人员将Sophy带回复调，并让一个由四辆Sophy控制的汽车组成的团队与四名专业的人类驾驶员进行对决。索菲队在三场比赛中的两场比赛中获得第一名，但总体得分低于身体温暖的队伍，因此放弃了比赛。

问题是，索菲学会了如何快速驾驶，但它不知道如何快速驾驶而不像个十足的傻瓜。索尼人工智能（Sony AI）董事兼项目负责人彼得·沃尔曼（Peter Wurman）说：“我认为我们都低估了正确对待体育道德的难度，[教Sophy]在面对竞争对手时不要过于咄逼人或过于胆小。”切换到Sophy在龙径海滨的第一个弯道上，一对对手刹车太迟，在赛道上用双轮滑行的片段。

一旦索菲不再做那些让它看起来很糟糕的事情，它在交通中的速度几乎和它独自使用沥青时一样快。从这种新发现的超人直觉中，它所使用的一些非常规技术变得显而易见。Gran Turismo制作人兼复调数字总监山内和弘（Kazunori Yamauchi）介绍了Sophy在GTPlanet上独特驾驶的一个例子：

“我是一名赛车手，学会了如何快速驾驶的技巧，比如慢进快出，”Gran Turismo的创始人山内和弘（Kazunori Yamauchi）说。“Gran Turismo Sophy不是这样学习的。我认为Sophy进入世界后，关于驾驶的教科书将不得不改变。例如，当Sophy进入弯道时，它实际上会转弯并刹车。通常，当你进入弯道时，负载只在两个前轮胎上，但Sophy的负载在三个轮胎上：两个在前轮胎上nt和一个在后面。它允许汽车在转弯时发生断裂，而按照惯例，人类是无法做到这一点的。最终会发生的是，它正在快速进入，快速离开。"

我认为，在Gran Turismo中，Sophy的一些技巧可能不会在一辆真正的汽车上得到很好的效果。尽管如此，Sophy对这项运动的理解和理念与世界上最好的球员不同，因此，他记录的圈数比他们快半秒到1.5秒。例如，它在龙径臭名昭著的“死亡奇卡”上穿针的方式，需要一定程度的精确性和勇气——除了世界上最好的车手之外，其他车手都能做到——即使是他们也可能不会始终如一地成功。

据推测，复调数字将在发布后的更新中以某种方式将Sophy带到Gran Turismo 7上——不仅作为竞争对手，还可能作为一名驾驶教练。就我个人而言，我认为GT7可以使用具有快速双手和体面赛车的人工智能，因为这是GT的计算机控制对手从未拥有过的东西。我会很高兴有一个淡化版，只是普通的快速；将galaxy brain fast版本留给专业人士。

tags users