随着技术使能够对语音产品的大规模转变,NVIDIA投资了150万美元的Mozilla常见声音来改变语音识别景观
在未来十年中,预计演讲将成为人们与设备互动的主要方式 - 从笔记本电脑和电话到数字助理和零售信息亭。然而,今天的语音设备无法理解世界语言,口音和言语模式的大量人性,因为他们无法理解巨大的围攻。
为了帮助确保各地的人们受益于这种大规模的技术转变,Mozilla正在与NVIDIA合作,该妇女正在投资150万美元的Mozilla常见声音,旨在民主化和多样化语音技术发展的雄心勃勃的开源倡议。
目前用于训练机器学习算法的大多数语音数据由少数主要公司举办。这对寻求开发高质量的语音识别技术的别人来说,这造成了挑战,同时还加剧了英语演讲者与世界其他地区之间的语音识别划分。
2017年推出,常见的声音旨在筹集比赛,同时缓解AI偏见。它使任何人都可以将他们的声音捐赠给自由,公开可用的数据库,该数据库可以用于培训启用语音的应用程序,产品和服务。今天,它代表了世界上最大的多语言公共领域语音数据集,其中60种不同的语言有超过9,000小时的语音数据,包括卢旺达和卢旺达等威尔士和KININARWANDA这样的广泛语言和较少使用的语言。迄今为止,全球超过164,000人促成了该项目。
这项投资将加快普通语音数据集的增长,从事项目中更多的社区和志愿者,并支持雇用新员工。
为了支持扩张,常见的声音现在将在Mozilla基金会的伞下作为其举措的一部分,专注于使人工智能更加值得信赖。据基金会执行董事,Mark Surman,常见的声音准备成为先锋数据捐款作为公众可以用来塑造技术的未来,以越好。
“语言是我们是谁的强大的一部分,人们,而不是营利的公司,是我们数字生活中如何出现的正确监护人,”Surman说。 “通过简单地捐赠语音数据,常见的语音赋予人们在创造有助于而不是危害人类的技术上发挥直接作用。 Mozilla和Nvidia都认为声音作为人们可以阻止控制技术并解锁其全部潜力的主要机会。“ “对话均衡的需求正在增长,聊天和虚拟助理影响几乎每个行业,”NVIDIA加速计算产品管理高级总监Kari Briski表示。 “与普通的语音的大型和开放的数据集,我们能够开发训练有素的型号,并为他们提供返回社区。 在一起,我们正在努力为支持和建设社区的共同目标 - 特别是对资源不足和不服务的语言。“