微软推出“ Group Transcribe”,这是一个用于面对面会议的转录和翻译应用程序

2021-03-04 00:19:26

要使用该应用程序,一个人将首先在自己的设备中启动会议。然后,他们可以邀请其他会议与会者通过蓝牙,可扫描的QR码或共享链接加入会话。在其他参与者加入会话之后,会议开始后,每个人都会看到成绩单在自己的设备上实时出现。

应用程序,它由A.I提供支持。语音和语言技术,能够基于在会议中使用的每只手机麦克风捕获的扬声器的音量来转换更高的准确性和扬声器归属。

通过比较人的语音卷的水平,云服务尝试确定哪个设备最接近扬声器和该扬声器的语言偏好。这意味着扬声器也被准确地标记在应用程序中,这可能是对其他转录应用程序的挑战,只有一个人正在录制。

此外,如果会见与会者想要用自己的语言发言,那么该应用程序可以用自己的语言向他人的设备提供翻译。

微软表示,该应用程序旨在考虑到可访问性,因为它使得聋人的人更容易通过实时转录和翻译更加充分地参加会议。

该项目本身是由微软员工建造的,这些员工通过十几种不同的语言和方言统称。

“这可能是一个很棒的沟通工具。我很乐意看到的是为了让人们跨多种语言讲述的人,“主要的开发领先,介绍该项目。

像大多数基于云的转录服务一样,该应用程序不应用于高度机密的会议。但是,Microsoft建立了细化的数据和隐私控制,使用户可以决定是否或何时共享对话数据。

为了工作,收集的音频和文本输入数据将发送到Microsoft的在线语音识别和翻译技术,尽管带有随机生成的标识符,而不是您的真实姓名。

尽管Microsoft不会在会议后自动保存会议记录和录音(它们已保存在您的设备中),但该应用程序确实鼓励参与者将会议记录“贡献”给Microsoft,从而可以改善服务。

这样,当所有与会人员都同意参加该会议时,Microsoft可以保留由音频和语音识别生成的文本转录。通过审查数据,微软旨在随着时间的推移改善其语音识别和说话者归因能力。然后,Microsoft员工和来自其他在Microsoft工作的公司的承包商都将根据NDA访问用户数据,但不包括任何发言人的帐户凭据。

评论者也只能访问随机的音频片段,而不能访问完整的录音。微软表示,通过删除可能代表信用卡号或电话号码之类的数字的长字符串来“取消识别”会议记录。该公司表示,用户可以随时删除以前共享的录音,但否则,它们将在加密服务器上保留长达2年。

由于企业无法在管理员级别上为所有用户配置或阻止“贡献”设置,因此人们应仔细权衡此类服务的优势和风险。这也是一个Microsoft Garage项目,这意味着它更具实验性,可以随时关闭。