像Siri、Google Now和Amazon Alexa这样的助手问世还不到十年,它们已经变得令人难以置信地无处不在。人们喜欢一个聪明的助手,他可以做任何人要求的事情。但是,如果你曾经尝试过测试这些助手中任何一个的极限,你很快就会意识到,他们只是还没有完全做到这一点。正如JR·拉斐尔在“计算机世界”(ComputerWorld)上所说的那样:
事实是,尽管语音助手取得了很大的进步,也有很多方便的方式,但它们仍然经常失败,不可靠。谷歌和其他公司越是推动他们的虚拟助手,并扩大他们的运营领域,纠正这个问题的挑战就变得越紧迫。
这些助理的未来会是什么样子呢?是不是有更多的技能?更多功能?我的观点是,虽然这些主流设备将慢慢改进,但它们的速度将比我们希望的要慢得多。由于这些助手纯粹是由自然语言处理和机器学习驱动的,失败是缺乏尚未开发的更复杂技能的自然结果。雇佣人工操作员来确保请求得到满足的成本将是站不住脚的-即使是对苹果这样的科技巨头来说也是如此。
2019年1月,亚马逊宣布Alexa设备销量超过1亿台。在大规模营销活动的支持下,这些设备的推出将导致语音助手技术的广泛采用和社会正常化。但他们将如何改进呢?
在过去的几年里,助理/礼宾领域的一些公司如雨后春笋般涌现出来。像Velocity Black这样的公司旨在创造面向超级富豪的高端礼宾服务,而其他公司,比如现在已经转型的GoButler,则试图为大众创造免费的礼宾服务。
这些新兴公司正专注于构建为用户创造真正价值的解决方案,超越了简单的信息传递。他们不仅帮你安排日历,还帮你安排现实生活中的事情。这些公司中的大多数都有一个共同点,那就是它们几乎完全由坐在电脑前的人类提供动力,不断地处理客户的请求。这意味着它们最终会受到人力和容量限制,这些限制永久地限制了它们的扩展能力,从而限制了它们对大量用户的用处。因此,供需定律规定,他们的服务必须变得更昂贵,更难获得,就像我们看到的另一款个人助理Magic在用户成群结队试图注册时所看到的那样。
未来充满了完全由人工智能驱动的助手的梦想。然而,除非发现人工通用智能,否则不久的将来很可能是混合的:虽然人类仍将是等式的一部分,但它们很可能会补充尖端的、不断学习的人工智能系统,这些系统逐渐承担着越来越多的工作。这将有助于扩大运力,降低这些服务对用户的成本。随着时间的推移,我们将达到这样的地步,人工智能系统和与现有应用程序的战略合作伙伴关系将为客户提出的绝大多数请求提供动力。我们不知道纯人工智能驱动的解决方案的未来会是什么样子,但机器学习方面的最新进展为我们提供了可能进入榜单的功能的线索。
1.了解情感。像Affectiva这样的公司已经建立了一些技术,这些技术利用了边缘计算的最新进展,使他们能够在用户的本地硬件设备上培训和运行复杂的深度学习模型。这些发展将使虚拟助理能够以非常经济高效的方式有效地分析语音,然后生成与短音频片段相关联的情感特征列表。简而言之,助手可以利用这样的技术来了解我们在与他们交谈时的感受,并提供帮助,或者根据需要做出富有同情心的回应。
2.了解你是谁。IBM Watson的个性洞察工具利用自然语言处理的最新进展和心理特征模型来分析简单的用户语音和用户生成的文本。该程序创建了一个用户的个性,相关的倾向,甚至购买的驱动因素的透彻的图片。助理服务可以使用这样的技术来更好地理解我们,并利用这些信息来调整他们与我们交谈的方式。
3.了解你想要什么。我和我在Twing的团队正在构建技术,允许用户要求我们做事情,告诉我们他们的喜好,并在运行中自动执行他们想要的东西。我们的工作采用了新的技术,利用了生成性对抗神经网络(GANS),这是一个系统,在这个系统中,多个相互竞争的神经网络接收大量数据,并相互竞争,以针对收集的训练数据生成最接近人类的动作。简而言之,该系统可以学习如何在现实世界中响应人类的语音行事。举个例子,你的助手会对你说早上好,帮你点你最喜欢的早餐到公司,给你做早间简报,让你知道去上班的优步很快就会到外面。
4.为你做任何事。这些现代助理中的大多数远远不只是简单的问答。事实上,他们通过API与数百家合作伙伴公司合作,代表你完成事情。
这些只是下一代助手通过利用机器学习和自然语言处理所能做的几个例子。归根结底,这些机器学习系统的能力是由使用情况驱动的;它们从一大群用户那里获得的数据越多,它们改进的速度就越快。
这些新的助手将能够做的一些事情将从根本上改变我们与我们的设备的关系,引发关于隐私的重大对话,并让人们更仔细地考虑他们应该与这些助手分享什么。我们是否仍然可以相信这些辅助服务背后的公司是以我们的最佳利益为依归呢?大公司免费或以令人难以置信的低价提供助理服务,这本身就是有好处的;例如,让助理只从母公司购买商品和服务。希望我们会被那些为用户提供以隐私为中心的服务的公司所吸引。
我相信下一代助手的未来在于人类和AI驱动的混合系统。他们会在现实世界中为你做事情(并得到你的同意),使用你的数据来了解你,做出明智的决定,并像真正的助手那样行事。自然语言处理、机器学习的进步,以及训练复杂深度学习系统的速度和可及性,是推动这些助手每分钟变得更聪明的原因。现实生活中的Jarvis-All-All不再太遥远了。
Build In的专家撰稿人网络发表由创新技术专业人士撰写的深思熟虑、以解决方案为导向的故事和评论。它是科技行业分享创新道路上令人信服的解决问题的第一人称描述的最终目的地。