LYRA - 为下亿用户启用语音呼叫

2021-04-07 00:41:53

过去的一年表明了在线沟通如何对我们的生活。从来没有在在线上清楚地了解相互了解,无论您是何处,无论提供哪些网络​​条件,都没有更重要。这就是为什么2月我们推出的Lyra:一种革命性的新音频编解码器,使用机器学习产生高质量的语音呼叫。作为我们普遍提供最佳编解码的努力的一部分,我们是开放的利润Lyra,允许其他开发人员为他们的通信应用程序提供电力​​,并在强大的新方向上占据Lyra。此版本提供了开发人员为使用LYRA进行编码和解码音频所需的工具,为64位ARM Android平台进行了优化,具有Linux的开发。我们希望扩展此Codebase并对社区串联的其他平台进行改进和支持。 Lyra的架构分为两件,编码器和解码器。当有人谈论他们的手机时,编码器从他们的演讲中捕获了独特的属性。这些语音属性也称为特征,在40ms的块中提取,然后通过网络压缩和发送。将功能转换回音频波形是解码器的作业,可以通过侦听器的电话扬声器播放。通过生成模型将特征被解码回波形。生成模型是一种特殊类型的机器学习模型,适合从有限数量的功能重新创建完整的音频波形。 LYRA架构与传统音频编解码器非常相似,这些音频编解码器已经形成了几十年来互联网通信的骨干。然而,这些传统编解码器基于数字信号处理(DSP)技术,LYRA的主要优势来自生成模型重建高质量的语音信号。虽然在过去十年中移动连接稳步增加,但设备上计算能力的爆炸性增长已经超出了可靠的高速无线基础设施的访问。对于这种对比存在的地区 - 特别是在下亿互联网用户在线即将推出的发展中国家 - 这是技术将使人们能够更加联系的承诺仍然难以捉摸。即使在具有高度可靠的连接的区域,工作的出现 - 从任何地方和远程办公室都具有进一步应变的移动数据限制。虽然Lyra将原始音频压缩到3kbps的质量,但对其他编解码器(例如Opus)有利地进行比较,但它并未旨在成为完整的替代方案,但可以在这些方案中节省有意义的带宽。这些趋势为Lyra提供了动机,并且是我们的开源库对其实时语音通信潜力的原因。我们识别我们识别的其他应用程序可能是独特的,从归档大量的语音,并通过利用计算上的Lyra编码器来节省电池,以减轻许多人试图立即拨打电话的紧急情况下的网络拥塞。我们很高兴看到创造力开源社区被众所周知,以便提出更独特和有影响力的应用程序。 LYRA代码用C ++编写的速度,效率和互操作性,使用Bazel Build框架与ABSEIL和Googletest框架进行彻底的单元测试。核心API提供用于在文件和分组级别编码和解码的接口。还提供完整的信号处理工具链,其包括各种滤波器和变换。我们的示例应用程序与Android NDK集成,以显示如何将本机Lyra代码集成到基于Java的Android应用程序中。我们还提供了运行Lyra所必需的重量和向量量化器。我们今天将Lyra释放为Beta版本,因为我们希望能够尽快启用开发人员并获得反馈。因此,我们预计API和比特流以开发而改变。运行Lyra的所有代码都在Apache许可证下开放,除了数学内核,提供共享库,直到我们可以在更多平台上实现完全打开的解决方案。我们期待着看到人们现在是开放的利润。查看GitHub上的代码和演示,让我们知道您的想法,以及您如何计划使用它! By Andrew Storus和Michael Chinen - Chrome以下人员帮助开源发布可能:Yero Yeh,Alejandro Luebs,Jamieson Brittle,Tom Denton,Felicia Lim,Bastiaan Kleijn,Jan Skoglund,Yaowu Xu,Jim Bankoski(Chrome),Chenjie顾,Zach Gleicher,Tom Walters,Norman Casagrande,Luis Cobo,Erich Elsen(深圳)。