微软的文字书写工具将很快能够录制和转录音频,这标志着从学生到记者再到微软高管,每个人都要求进行长期的改进。然而,与竞争对手相比,它的功能明显有限。
这项新的转录技术将向通过网络浏览器使用Word写作的微软365订户免费提供,允许人们录制和上传音频文件,这些文件通常会在瞬间被转录。在周一与记者进行的演示中,微软展示了它可以很好地将电脑扬声器的输出录制到内置麦克风上(因此,没有插入耳机)。人们还可以将预先录制的音频上传到该服务。
但这就是它与竞争对手相匹配的功能结束的地方,也是它无法完成的任务开始堆积的地方。
转录功能只适用于网页版的Word,不适用于其桌面Windows或Mac应用程序,也不适用于其移动伙伴。微软表示,希望在今年年底前将这项技术用于手机和平板电脑,但不会承诺为桌面应用程序提供这项技术。
竞争对手,如谷歌(Google)为搭载其Android软件的手机开发的语音转录工具,可以使用更多语言,或者离线工作。例如,像Otter.ai这样的应用程序提供了更容易的搜索、标记和共享。
微软表示,与竞争对手相比,它提供的是在其应用程序套件中记录、存储和访问文字记录的简单性。
致力于这一新功能的微软团队项目经理丹·帕里什(Dan Parish)表示:我们确实处于独特的地位,可以帮助提供一站式商店,在这里,你的音频、录音记录、笔记,最终你的故事都可以放在一个熟悉的安全工具中。他说,这项技术源于微软的努力,目的是帮助人们花更少的时间和精力创作他们最好的作品,真正专注于最重要的事情。
微软提供抄写技术的举动标志着一个变化,即使是该公司也承认这是一个很长时间才会到来的变化。人们在生活的许多方面越来越依赖语音技术,无论是在做饭时打开音乐,在开车时发送短信,还是在智能电视上查找电影。即使是美国政府也依赖自动语音记录来帮助保存总统的一些电话记录。
随着人们越来越多地适应不在办公室工作,微软表示,它的抄写软件可以提供帮助--既可以做笔记,也可以在开会期间突然被孩子或宠物打扰时充当第三者。
例如,微软表示,如果人们使用网络浏览器,它将允许他们无限制地录制音频,但如果他们稍后录制并上传,比如如果他们在互联网很差的教室里,则限制在每月300分钟(5小时)以内。微软还表示,人们上传的每个音频文件必须是200MB,或者说大约75分钟的低质量单声道MP3录制。和其他服务一样,人们可以上传MP3、WAV、MP4和M4A文件,尽管其他服务(如Otter.ai)也支持各种电影文件,如AVI、MOV和MPG。
微软还表示,在Word中录制的录音将在按下停止键的瞬间进行转录,部分原因是微软实际上是在幕后转录。然而,上传的音频文件可能需要与录音本身一样长的时间来转录。
但微软表示,就精确度而言,它认为自己绝对是业界的佼佼者。这在一定程度上要归功于它与Azure认知服务技术的联系,该技术多年来一直在提炼。
帕里什说,总的来说,显然,我们对我们在这里生产的质量相当有信心。
尊重他人,保持文明礼貌,不离题。我们删除违反我们政策的评论,我们鼓励您阅读这些评论。我们可以随时关闭讨论线程。