Facebook称其“搅拌机”聊天机器人是有史以来最人性化的

2020-05-02 17:55:53

多年来,研究人员一直在试图建立能够像人类一样进行自然对话的人工智能系统。然而,到目前为止,这些努力只在狭窄的、专门的和预先编程的任务中取得了成功。

三个月前,谷歌发布了Meena,一款神经网络驱动的聊天机器人。Meena在敏感度和特异度平均值(SSA)上的表现明显优于其他聊天机器人,SSA是一种基于类似人类的多轮对话关键要素的评估指标。

Facebook的研究人员在一篇博客文章中夸口说:“这是第一个将多种对话技能--包括同理心、知识和个性--融合在一个系统中的聊天机器人。”

研究人员让Blender和Meena进行了较量,确定“在人类对参与度的评估中,我们最好的模特在两两比较中,75%比Meena高出75%对25%,在人性化方面比Meena高出65%对35%。”

在一篇相关的论文中,研究人员总结了他们构建这种开放领域聊天机器人的方法-包括规模、混合技能和生成策略。我们通过一种新的聊天机器人配方实现了这一里程碑,其中包括改进的解码技术,新颖的技能融合,以及一个拥有94亿参数的模型,这是现有最大系统的3.6倍。“。

Blender创造的第一步是大规模的培训。该团队对大型变形金刚神经网络进行了大量对话数据的预先训练,并使用先前可用的公共领域对话,其中包括15亿个提取对话的训练示例。

他们还介绍了一种新颖的混合技能谈话(BST),用于培训和评估搅拌机所需的技能。基于他们之前的研究,前提是一个理想的聊天机器人需要知识渊博,有个性,并能够表现出同理心。然而,混合这些技能可能会很困难,因为系统必须能够在适当的时候在不同的任务之间切换。BST数据集提供了一种构建系统的方法,该系统可以自动、适当地混合和展示这些内容……。

生成策略,如光束搜索、下一个令牌采样和n元语法阻塞,通常在模型训练后使用,以确保会话代理不会重复自己或断章取义。研究人员分析了这些生成策略,例如,确定代理人的话语长度对于与人类评估者取得更好的结果特别重要。

研究人员还指出,与最近的一些研究表明波束搜索不如采样相反,选择搜索超参数可以通过控制权衡来改善结果。具体地说,限制最小光束长度对反应的平淡和辛辣光谱具有至关重要的控制作用。

尽管取得了令人印象深刻的性能成就,但研究人员强调,在解决开放领域对话方面仍有许多工作要做。他们目前正在探索如何在与新架构和不同损失功能的更长对话中提高模型的对话质量。

为了鼓励和协助全球对话式人工智能研究,该团队决定发布完整的模型、代码和评估设置,以使其他人工智能研究人员能够复制、探索并在工作的基础上再接再厉。

“构建开放域聊天机器人的秘诀”在arxiv上,代码可以在这里找到。