通过正强化教学机器人

2020-10-27 05:49:49

世界上可能没有一个机器人教师学院积极从事机器人学习。毕竟,这个领域掌握着释放该行业巨大潜力的关键。让它如此引人注目的一件事是,如此多的研究人员正在采取无数不同的方法来解开帮助机器人从根本上从头开始学习的秘密。

约翰·霍普金斯大学的一篇新论文探讨了通过正面强化学习的潜力,这篇论文的名字确实令人愉快,名为“好机器人”(Good Robot)。这个名字源于作家安德鲁·亨特(Andrew Hundt)关于教他的狗不要追赶松鼠的轶事。我不会在这里详述这一点-你可以只看这段视频:

但这个想法的核心是在机器人做正确的事情时给它提供某种形式的激励,而不是在它做错了事情时给它一种抑制。对于机器人来说,激励以评分系统的形式出现-本质上是一种游戏化,在正确执行任务的基础上奖励一些分数。

这位博士生说,这种方法能够显著减少任务的培训时间。“机器人想要更高的分数,”亨特在一份与研究相关的新闻稿中说。“它很快就学会了正确的行为,以获得最好的回报。事实上,过去机器人需要一个月的练习才能达到100%的准确率。我们在两天内就能做到这一点。“。

这些任务仍然相当初级,包括堆砌砖块和在视频游戏中导航,但未来的机器人将有希望能够完成更复杂、更有用的现实世界任务。