#语音

民意调查：只有18％的德国人在公共场合可以自由地进行语音观点（2019年）

Poll: Only 18 Percent of Germans Feel Free to Voice Views in Public (2019)(jonathanturley.org)

2021-6-15 19:59

多年来，我们讨论了欧洲自由讲话的无情攻击，扩大了仇恨言语法以及包括国际言论犯罪，包括国际言论犯罪。美国的一些人希望跟进那种危险的道路（和大学加强了对言语的需要）。这种反致辞政策的含义在德国是明显的，在德国，由Institutfür·德莫斯基斯基斯巴赫（并在法兰克福官能河九麦内泻Zeitung发表）的调查发现，发现只有......

可以面对和语音识别成为新的“膈宫”？

Could face and voice recognition become the new 'phrenology'?(www.cbc.ca)

2021-6-13 23:47

在19世纪初的火花，一些科学家们表示相信他们可以预测某人＆＃39;基于他们头的形状的人格和行为。作为膈宫，这种伪科学加速了种族主义的概念，智力优势，并因为他们看起来像他们看起来像什么 - 有些人甚至被监禁，因为他们的头骨的轮廓建议＆＃34;犯罪。＆＃34 ; 然而，有些人警告语音和面部识别计划的高级用......

电报：付款2.0，预定语音聊天，新网页版本

Telegram: Payments 2.0, Scheduled Voice Chats, New Web Versions(telegram.org)

2021-4-28 10:48

此更新为语音聊天的所有电报聊天，调度和迷你配置文件带来付款2.0，为您的浏览器提供新的电报应用程序等。我们首先在2017年增加了支付。付款机床允许用户安全地支付货物和服务，而不留下应用程序 - 任何从订购披萨到海上兴奋的东西，以换冬季轮胎+39;重新厌倦了冬季。从今天开始，商家可以在任何聊天中自然地接受信用......

Mozilla风向下深入开发，宣布拨款计划

Mozilla winds down DeepSpeech development, announces grant program(venturebeat.com)

2021-4-13 22:44

加入GamesBeat Summit 2021 4月28日至29日。今天注册免费或VIP通过。 2017年，Mozilla推出了DeepSpeech，这是一项潜入Mozilla Research的机器学习团队，专注于开放采购自动语音识别模型。在接下来的四年中，DeepSeech团队发布了更新的模型版本，能够转录讲座......

Mozilla与Nvidia合作，以民主化和多样化的语音技术

Mozilla partners with Nvidia to democratize and diversify voice technology(blog.mozilla.org)

2021-4-13 6:22

随着技术使能够对语音产品的大规模转变，NVIDIA投资了150万美元的Mozilla常见声音来改变语音识别景观在未来十年中，预计演讲将成为人们与设备互动的主要方式 - 从笔记本电脑和电话到数字助理和零售信息亭。然而，今天的语音设备无法理解世界语言，口音和言语模式的大量人性，因为他们无法理解巨大的围攻。为了帮助......

NVIDIA在普通可用性之后启动Jarvis会话AI框架，自去年5月在预览中推出以来

Nvidia launches Jarvis conversational AI framework in general availability, after garnering 45K+ downloads since launching in preview in May of last year(venturebeat.com)

2021-4-13 1:13

加入GamesBeat Summit 2021 4月28日至29日。今天注册免费或VIP通过。在其GTC 2021，NVIDIA今天上午宣布了其Jarvis框架的一般可用性，它为开发人员提供了预追溯的AI模型和软件工具，以创建交互式会话体验。 NVIDIA表示，Jarvis模型首次在5月20日在预览中获得的，提供......

微软在高级会谈中购买演讲识别公司Nuance

Microsoft in advanced talks to buy speech-recognition company Nuance(www.cnbc.com)

2021-4-12 11:58

一个熟悉谈判的一个人说，可以宣布一项交易。该人表示，微软首次接近12月的细微差别，并愿意支付每股约束约56美元的细微差别。这将使股票价值约为160亿美元，股票上的23％的溢价和＃39;星期五关闭价格为每股45.58美元。 160亿美元，差别将是微软的第二大收购，在2016年在购买Linkedin购买后的27......

Google开放来源Lyra In Beta，一种使用ML的音频编解码器，用于为低带宽网络创建高质量的语音呼叫或归档大量的语音

Google open sources Lyra in beta, an audio codec that uses ML to create high-quality voice calls for low-bandwidth networks or archiving large amounts of speech(venturebeat.com)

2021-4-7 4:15

加入Interprise AI＆amp中最重要的主题转换2021;数据。学到更多。谷歌今天开放的Lyra In Beta，一种使用机器学习的音频编解码器生产高质量的语音呼叫。谷歌说，在GitHub上提供的代码和演示，将原始音频压缩到每秒3千比特，“质量与其他编解码器相比。” 虽然在过去十年中移动连接稳步增加，但......

演讲到鸟类转换

Speech to Birdsong Conversion(www.windytan.com)

2021-3-30 4:58

一天晚上我有一个梦想，黑鹂在人类语言中谈论。当我醒来时，实际上有一个黑鸟在窗外唱歌。它的变形是奇怪的言语。梦想的思想只需要想象一堆额外的谐波来形成音素和单词。一个人留下了想知道语音可以通过隔离其中一个谐波来转换为黑鸟歌曲...... 找到语音的瞬时基础频率和幅度。例如，过滤谐波，并使用FM解调器找到频率。然后通过......

Amazon Echo获得开源脑移植

Amazon Echo Gets Open Source Brain Transplant(hackaday.com)

2021-3-23 5:9

亚马逊的Alexa生态系统很少有争论，可以轻松地将语音控制添加到您的智能家中，但不是每个人都以它的工作方式激动人心。所有命令都被解除为亚马逊的服务器，而不是保持网络的内部，而是绝对无法为我们越来越多的隐私，而且诚实地，很难责怪他们。当你想到它时，整件事都很令人毛骨悚然。这恰恰是为什么[AndréHentschel......

Lyra音频编解码器可实现3 kbps比特率的高质量语音通话

Lyra audio codec enables high-quality voice calls at 3 kbps bitrate(www.cnx-software.com)

2021-3-2 5:15

我们经常写关于AV1或H.266之类的新视频编解码器的信息，最近，我们介绍了AVIF图片格式，该格式相对于WebP和JPEG具有更高的质量/压缩率，但是在音频编解码器方面也有很多工作要做。值得注意的是，我们注意到Opus 1.2在2017年发布时以低至12 kbps的比特率提供了不错的语音质量，2019年Opus......

Lyra：一种用于语音压缩的新型超低比特率编解码器

Lyra: A New Very Low-Bitrate Codec for Speech Compression(ai.googleblog.com)

2021-2-27 9:37

2021年2月25日，星期四

Verbz：基于语音的消息传递

Verbz: Voice-based messaging(www.verbz.ai)

2021-2-26 1:24

通过说出您需要完成的工作立即分配任务，设置提醒并标记同事。真正的任务，真正的快速。添加照片，格式，编辑和共享。 Verbz是一款功能强大的语音记事本，适用于您和您的团队。分享反馈，讨论问题并以惊人的速度聊天。跳过会议，说出来。

Flutter中的离线语音识别：否Siri，否Google和否，不是STT

Offline Speech Recognition in Flutter: No Siri, No Google, and No, It’s Not STT(medium.com)

2021-2-19 23:50

我无需告诉您有关免提移动应用在21世纪的重要性。我要告诉您的是，将其添加到Flutter项目中比想象的要容易。 Picovoice最近发布了一系列Flutter软件包，使您可以在公园散步时将脱机语音命令添加到您的移动应用程序中。不，是认真的-做完之后，您将有时间在公园里散步。在本教程中，我从去年无处不在的#flu......

Deepfake语音技术：很好。不好未来

Deepfake Voice Technology: The Good. The Bad. The Future(www.econotimes.com)

2021-2-9 20:5

基于语音克隆或人声准完美复制的Deepfake语音技术，无论好坏，都可以使用。可以将其用于语音合成，该语音合成可以将语音返回给由于急性或慢性疾病（如ALS，失用症，脑外伤，中风等）而失去语音的人。它已经在影视行业，游戏，呼叫中心中使用，并且对于加密和治疗也很方便。但是，不可否认的是，它可能对民主进程，尤其是与隐......

深度学习文本到语音工具，用于生成各种字符的语音

Deep-learning text-to-speech tool for generating voices of various characters(15.ai)

2021-1-9 2:43

15.ai：自然，高质量，快于实时的文本到语音合成，数据量最少

人工智能现在惊人地擅长于听起来人类

Artificial Intelligence Is Now Shockingly Good at Sounding Human(www.scientificamerican.com)

2021-1-8 21:42

合成声音无处不在。他们会在早上为我们提供指示，在白天通过电话引导我们，并在晚上通过智能扬声器播报新闻。随着用于制作它们的技术的改进，这些声音也变得越来越人性化。这是合成语音的最后一个领域：不仅复制我们所说的内容，而且复制我们怎么说的方式。鲁帕尔·帕特尔（Rupal Patel）领导东北大学的一个研究小组，研究语音韵律......

拨号：意外语音聊天

Dialup: Serendipitous Voice Chat(dialup.com)

2020-12-28 18:14

与您想认识的人打个电话。无论是讨论您正在阅读的书，早餐是做早餐还是满月，Dialup都会自动安排您的电话铃声，并在一对一的对话中将您随机配对。您无需记住打电话。拨号电话给您。根据您的特定兴趣结识其他人。是否希望有机会在周四的下午与陌生人讨论科幻小说的写作？您可能在通话中彼此匹配。您将永远知道这是来自......

电报语音聊天

Telegram Voice Chats(telegram.org)

2020-12-23 21:27

自2013年以来，我们一直在扩展群聊的定义，添加了诸如回复，带有智能通知的提及，高级民意调查，管理工具，群组统计信息之类的功能，并且每个群组允许成千上万的成员。这些功能中的许多功能后来被合并到其他应用程序中，并重新定义了人们的交流方式。如今，Telegram组通过语音聊天获得了全新的面貌–持续的电话会议，成员可以......

人工智能现在惊人地擅长于听起来人类

Artificial Intelligence Is Now Shockingly Good at Sounding Human(www.scientificamerican.com)

2020-12-18 22:37

Papercup是英国初创公司，使用AI进行逼真的语音翻译，筹集了800万英镑的资金

Papercup, the UK startup using AI for realistic-sounding voice translation, raises £8M funding (techcrunch.com)

2020-12-10 17:9

本轮融资由LocalGlobe和Sands Capital Ventures以及Sky，GMG Ventures，Entrepreneur First（EF）和BDMI牵头。 Papercup表示，新资金将用于进一步投资于机器学习研究，并扩展其“人在回路”质量控制功能，该功能将用于改善和定制AI翻译视频的质量。同......

录制语音并将其训练为TTS语音

Record and train voice into a TTS voice(github.com)

2020-12-9 19:52

Mycroft开源Mimic技术是文本到语音引擎，它采用一段书面文本并将其转换为语音音频。该技术的最新一代，即Mimic 2，使用机器学习技术来创建一个能够说一种特定语言的模型，听起来像是经过训练的配音。 Mimic Recording Studio简化了个人培训数据的收集，每个培训数据都可用于为Mimic发出独特......

亚马逊推出了一项功能，该功能使用户可以在iOS上向Alexa发送短信，而不是仅使用语音来询问事情，现在可以在公共预览中使用。

Amazon introduces a feature that lets users text Alexa on iOS to ask for things instead of only using their voice, now available in public preview(www.theverge.com)

2020-12-4 21:21

亚马逊正在为其iOS Alexa应用程序测试一项新功能：键入Alexa命令的功能，而不必大声说出问题或要求。 “使用Alexa键入是iOS Alexa应用程序客户可以使用的公共预览功能，使您无需使用语音即可与Alexa进行交互，这意味着您现在可以使用Alexa移动应用程序键入对Alexa的所有信息。亚马逊发言人表示......

Serenade获得210万美元的种子轮融资，将语音转换为代码

Serenade snags $2.1M seed round to turn speech into code (techcrunch.com)

2020-11-23 23:24

今天，该公司宣布了由Amplify Partners和Neo领导的210万美元的种子投资。在启动时，这家初创公司还宣布了该产品的第一个商业版本Serenade Pro。 “ Serenade是一款应用程序，您可以将其下载到计算机上。它会插入您现有的编辑器（例如Visual Studio Code或IntelliJ）......

从事语音技术25年了，但我仍然不和我的电脑说话

25 Years In Speech Technology and I still don’t talk to my computer(matthewkaras.medium.com)

2020-10-27 0:26

这些都是个人的思考和观察，其中一些可能看起来很固执己见，或者根本就是错的。请随意评论，我可能不会被冒犯。 1994年我在剑桥读研究生时，师从史蒂夫·杨(Steve Young)和托尼·罗宾逊(Tony Robinson)，他们创造了一些世界上最好的语音识别系统。然而，我在最初的几天里学到的最重要的东西，是我从看过早期......

人工智能在语音识别方面的表现优于人类

AI outperforms humans in speech recognition(techxplore.com)

2020-10-22 18:32

跟踪并准确转录对话是人工智能(AI)研究中最大的挑战之一。卡尔斯鲁厄理工学院(KIT)的研究人员目前首次成功开发出一种计算机系统，该系统在识别这种潜伏期最短的自发语言方面比人类表现得更好。这是在arxiv.org上报道的。KIT信息学教授亚历克斯·怀贝尔(Alex Waibel)表示，当人们相互交谈时，会有停顿、口吃......

GNU/Jami，一个分布式语音、视频和聊天平台

GNU/Jami, a distributed voice, video and chat platform(jami.net)

2020-10-20 1:42

不受文件大小、速度、带宽、功能、帐号数量、存储或任何其他方面的限制。同一本地网络上的用户可以与Jami通信，即使他们与互联网断开连接。

索尼表示，PS5不会主动监听你的语音聊天

PS5 won’t actively monitor or listen to your voice chat, Sony says(www.polygon.com)

2020-10-19 3:55

索尼(Sony)公布了有关PlayStation5语音聊天录音的新细节。本周早些时候，该公司发布了最新的PlayStation4系统软件更新，用户出人意料地听说了这一功能，这似乎让该公司措手不及。索尼互动娱乐(Sony Interactive Entertainment)负责全球消费者体验的副总裁凯瑟琳·延森(Ca......

语音浏览器-语音控制的Web浏览器

Voce-browser – voice Controlled Web Browser(github.com)

2020-10-18 23:10

Voce Browser是使用PyQtWebEngine的基于铬的语音控制浏览器。它拥有Chrome或Firefox等所有基本的浏览器功能，此外，它还可以通过语音命令进行控制。本项目使用Qt GUI库Python绑定作为用户界面。语音浏览器可以被给予语音命令，这些命令被翻译，然后使用Google语音识别API执行。......

使用Reaction构建实时语音用户界面

Build real time voice user interfaces with React(www.speechly.com)

2020-10-16 9:6

Speechly是一款用语音方式增强触摸用户界面的工具。除了触摸和点击之外，最终用户还可以使用最自然的方式与应用程序交互-语音。这篇博客是关于为什么你应该使用Speechly Reaction客户端来构建你的下一个多模式用户体验。如果您已经知道了，可以直接跳到我们的Reaction客户端入门教程并开始开发。到目前......