加入GamesBeat Summit 2021 4月28日至29日。今天注册免费或VIP通过。
在其GTC 2021,NVIDIA今天上午宣布了其Jarvis框架的一般可用性,它为开发人员提供了预追溯的AI模型和软件工具,以创建交互式会话体验。 NVIDIA表示,Jarvis模型首次在5月20日在预览中获得的,提供自动语音识别,以及语言理解,实时语言转换和对话代理的文本语音功能。
由大流行激发的智能手机和消息应用程序的无处不在 - 促进了增加的会话技术的采用。在一项调查中,五十六家公司在调查中讲述了会谈机器人和其他经验正在推动他们的行业中断。和Twilio的研究显示,10个消费者中有9个,希望使用消息传递联系业务。
利用GPU加速,JARVIS的管道可以在100毫秒内运行并在数据中心或边缘中部署在云中。该框架包括培训超过10亿页的文本和超过60,000小时的演讲,可以进行调整,优化,微调定制数据,并针对不同的任务,行业和系统定制。
T-Mobile是Jarvis的早期用户之一,贾维斯 - 支持五种语言,包括英语,中文和日语 - 自去年初获得超过45,000次下载。根据NVIDIA的说法,电信巨头正在使用该框架来帮助实时解决客户服务问题。
甚至在大流行之前,自治代理也在成为规则而不是例外的路上,部分原因是消费者更喜欢这种方式。根据去年的Vonage子公司新Voicemedia的研究报告,25%的人更愿意通过聊天或其他自助替代方案来处理他们的疑问。 Salesforce表示,大约69%的消费者选择Chatbots以便与品牌快速沟通。
Nvidia还宣布它与Mozilla Common Docum合作,一个开源收集的初创公司,研究人员和开发人员的语音数据,用于培训启用语音的应用程序,服务和设备。世界上最大的多语言公共领域语音数据集,常见声音包含超过9,000多小时的贡献语音数据,以60种不同的语言。 NVIDIA表示,它正在使用Jarvis与数据集一起开发掠夺模型,然后它将免费提供给社区。
“我们推出了普通的声音来教导机器的真实人类如何用独特的语言,口音和语音模式发言,”Mozilla执行董事Mark Surman在新闻稿中表示。 “NVIDIA和Mozilla对民主化的语音技术具有共同的愿景 - 并确保它反映了构成互联网的人民和声音的丰富多样性。”
新揭示了Jarvis的特点将在2021年第二季度发布,作为NVIDIA正在进行的开放式测试计划的一部分。开发人员可以从NVIDIA的NGC目录下载此框架。
VidtureBeat' S使命是成为技术决策者的数字城市广场,以获得有关转型技术和Transact的知识。您网站提供有关数据技术和策略的基本信息,以指导您的领导您的组织。我们邀请您成为社区的成员,访问:门控思想领导者内容和对我们奖化事件的折扣访问,如转换2021:了解更多
成为会员