感染新冠肺炎的无症状人群,从定义上讲,没有明显的疾病身体症状。因此,他们不太可能寻求病毒检测,并可能在不知不觉中将感染传播给其他人。
但似乎那些没有症状的人可能并不完全没有病毒造成的变化。麻省理工学院的研究人员现在发现,没有症状的人可能在咳嗽方式上与健康人不同。这些不同之处是人耳无法辨认的。但事实证明,它们可以被人工智能拾取。
在最近发表在IEEE医学和生物学工程杂志上的一篇论文中,该团队报告了一种人工智能模型,该模型通过强迫咳嗽录音将无症状的人与健康的人区分开来,人们通过网络浏览器和手机和笔记本电脑等设备自愿提交这些录音。
研究人员对数万个咳嗽样本和口语进行了模型训练。当他们给模型提供新的咳嗽记录时,它准确地识别了98.5%的咳嗽,这些咳嗽来自被确认患有新冠肺炎的人,包括100%来自无症状的咳嗽-这些人报告说他们没有症状,但病毒检测呈阳性。
该团队正在致力于将该模型整合到一款用户友好的应用程序中,如果美国食品和药物管理局批准并大规模采用该应用程序,该应用程序可能会成为一种免费、方便、非侵入性的预筛查工具,用于识别可能没有新冠肺炎症状的人。用户可以每天登录,对着手机咳嗽,立即获得他们是否可能被感染的信息,因此应该通过正式测试进行确认。
“如果每个人都在去教室、工厂或餐馆之前使用这个群体诊断工具,那么这个群体诊断工具的有效实施可以减少流行病的传播,”该研究的合著者、麻省理工学院自动ID实验室的研究科学家布莱恩·苏比拉纳(Brian SuBirana)说。
苏比拉纳的合著者是麻省理工学院自动识别实验室的乔迪·拉瓜尔塔和费兰·休托。
在大流行爆发之前,研究小组已经在训练手机咳嗽录音的算法,以准确诊断肺炎和哮喘等疾病。以类似的方式,麻省理工学院的团队正在开发人工智能模型来分析强迫咳嗽的录音,看看他们是否能检测到阿尔茨海默氏症的迹象,这是一种不仅与记忆力下降有关的疾病,还与神经肌肉退化有关,如声带虚弱。
他们首先训练了一种名为ResNet50的通用机器学习算法或神经网络,以区分与声带强度不同程度相关的声音。研究表明,声音“mmmm”的质量可以指示一个人的声带有多弱或多强。苏比拉纳在一个1000多小时的有声读物数据集上训练神经网络,让它从“the”和“Then”等其他单词中挑选出“They”这个单词。
研究小组训练了第二个神经网络来区分言语中明显的情绪状态,因为阿尔茨海默氏症患者-以及更普遍的神经功能减退的人-已经被证明比他们表达快乐或平静更频繁地表现出特定的情绪,如沮丧或平淡的情绪。研究人员开发了一个情感语音分类器模型,通过在演员语调为中性、平静、快乐和悲伤等情绪状态的大型数据集上进行训练,开发了一个情感语音分类器模型。
研究人员随后在咳嗽数据库上训练了第三个神经网络,以辨别肺部和呼吸性能的变化。
最后,研究小组结合了所有三种模型,并叠加了一种检测肌肉退化的算法。该算法本质上是通过模拟音频掩膜或噪声层,并区分强烈的咳嗽-那些可以在噪音上听到的咳嗽-而不是较弱的咳嗽来做到这一点。
使用他们新的人工智能框架,研究小组输入了音频记录,包括阿尔茨海默氏症患者的录音,并发现它可以比现有模型更好地识别阿尔茨海默氏症样本。结果表明,声带强度、情绪、肺和呼吸功能以及肌肉退化是诊断该病的有效生物标志物。
当冠状病毒大流行开始展开时,苏比拉纳想知道他们针对阿尔茨海默氏症的人工智能框架是否也适用于诊断新冠肺炎,因为越来越多的证据表明,感染患者经历了一些类似的神经症状,如暂时性神经肌肉损伤。
“说话和咳嗽的声音都受到声带和周围器官的影响。这意味着当你说话的时候,你说话的一部分就像咳嗽,反之亦然。这也意味着,我们很容易从流利的语言中获得一些东西,人工智能可以简单地从咳嗽中学到东西,包括这个人的性别、母语,甚至是情绪状态。苏比拉纳说:“事实上,咳嗽的方式中蕴含着情感。”“所以我们想,为什么我们不试试这些阿尔茨海默氏症的生物标记物(看看它们是否与Covid相关)。”
今年4月,研究小组开始收集尽可能多的咳嗽记录,包括新冠肺炎患者的咳嗽记录。他们建立了一个网站,人们可以在那里通过手机或其他具有网络功能的设备记录一系列咳嗽。参与者还填写了一份关于他们正在经历的症状的调查,无论他们是否患有新冠肺炎,他们是通过官方测试、医生对他们症状的评估还是自己诊断出来的。他们还可以记录自己的性别、地理位置和母语。
到目前为止,研究人员已经收集了超过7万份录音,每个录音包含几次咳嗽,总共有大约20万个强迫咳嗽的音频样本,苏比拉纳说这是“我们所知的最大的研究咳嗽数据集”。大约2,500份录音是由被确认患有新冠肺炎的人提交的,其中包括那些没有症状的人。
研究小组使用了2500个与Covid相关的录音,以及他们从集合中随机选择的2500多个录音,以平衡数据集。他们使用了4000个这样的样本来训练人工智能模型。剩下的1000段录音然后被输入到模型中,看看它是否能准确地区分Covid患者和健康人的咳嗽。
令人惊讶的是,正如研究人员在他们的论文中所写的那样,他们的努力揭示了“阿尔茨海默氏症和Covid歧视之间惊人的相似之处。”
在最初针对阿尔茨海默氏症的人工智能框架内没有太多调整,他们发现它能够提取新冠肺炎特有的四个生物标志物的模式-声带强度、情绪、肺和呼吸表现以及肌肉降解。该模型识别了98.5%与新冠肺炎确认的人的咳嗽,其中,它准确地检测到了所有无症状的咳嗽。
苏比拉纳说:“我们认为这表明,当你有Covid时,即使你没有症状,你产生声音的方式也会改变。”
苏比拉纳强调,人工智能模型并不是为了诊断有症状的人,只要他们的症状是由于新冠肺炎还是其他疾病,如流感或哮喘。该工具的优势在于它能够区分无症状咳嗽和健康咳嗽。
该团队正在与一家公司合作,基于他们的人工智能模型开发一款免费的预筛选应用程序。他们还与世界各地的几家医院合作,收集更大、更多样化的咳嗽记录,这将有助于训练和加强模型的准确性。
正如他们在论文中提出的那样,“如果预先筛查工具总是在后台运行并不断改进,那么大流行可能会成为过去。”
最终,他们设想,像他们开发的音频人工智能模型可能会被整合到智能扬声器和其他听力设备中,这样人们就可以方便地对自己的疾病风险进行初步评估,可能是每天。