Google开放来源Lyra In Beta,一种使用ML的音频编解码器,用于为低带宽网络创建高质量的语音呼叫或归档大量的语音

2021-04-07 04:15:16

加入Interprise AI&amp中最重要的主题转换2021;数据。学到更多。

谷歌今天开放的Lyra In Beta,一种使用机器学习的音频编解码器生产高质量的语音呼叫。谷歌说,在GitHub上提供的代码和演示,将原始音频压缩到每秒3千比特,“质量与其他编解码器相比。”

虽然在过去十年中移动连接稳步增加,但设备上的爆炸性增长已经超出了可靠,快速互联网的访问。即使在具有可靠连接的地区,工作的出现 - 从任何地方和远程办公室都有拉伸的数据限制。例如,在大流行中,据BroadBandNow称,在大流行中,前200名美国城市的近90名互联网速度下降,随着带宽的调整。

它是谷歌的断言,即Lyra可以在这些场景中产生差异。

LYRA的架构分为两件,编码器和解码器。当有人进入他们的电话时,编码器从他们的演讲中捕获称为特征的独特属性。 Lyra在40毫秒的块中提取这些功能,然后压缩并通过网络发送它们。将功能转换回音频波形的解码器的作业是可以通过侦听器的电话播放的音频波形。

根据Google的说法,Lyra的架构类似于传统的音频编解码器,它形成了互联网通信的骨干。但是,虽然这些传统的编解码器基于数字信号处理技术,但LYRA的关键优势来自其解码器重建高质量信号的能力。

谷歌认为有许多应用程序Lyra可能是独特的,从归档大量的言语和节省电池,以减轻紧急情况下的网络拥塞。

“我们很高兴看到创造力开源社区被众所周知,以便提出更独特而有影响力的应用,”谷歌浏览器工程师Andrew Storus和Michael Chinen在博客文章中写道。 “我们[想要]启用开发人员并尽快获得反馈。”

Lyra代码使用Bazel Build Framework用C ++编写。核心API提供用于在文件和分组级别进行编码和解码的接口,并且提供完整的信号处理工具链,其包括滤波器以及变换。 Google的示例代码与Android NDK集成,以显示Lyra如何使用基于Java的Android应用程序,谷歌还提供了运行Lyra所需的重量和向量量化器。

“此版本提供了开发人员为使用LYRA进行编码和解码音频的工具,针对64位ARM Android平台进行了优化,在Linux开发,”Storus和Chinen继续。 “我们希望扩展此Codebase并对社区串联的其他平台制定改进和支持。”

VidtureBeat' S使命是成为技术决策者的数字城市广场,以获得有关转型技术和Transact的知识。您网站提供有关数据技术和策略的基本信息,以指导您的领导您的组织。我们邀请您成为社区的成员,访问:门控思想领导者内容和对我们奖化事件的折扣访问,如转换2021:了解更多

成为会员