语音识别技术是另一个偏见的例子

2020-07-12 23:11:57

“Clow-dia,”我说过一次。两次。第三次了。失败了,我说的是我名字的美国化版本:“爪子-迪-啊。”最终,Siri认识到了这一点。

对于母语不是英语或没有传统的美式发音名字的人来说,不得不调整我们的说话方式来与语音识别技术互动是一种熟悉的经历。正因为如此,我甚至已经不再使用Siri了。

在过去的几十年里,语音识别技术的实施揭示了一个根深蒂固的问题:种族偏见。最近发表在PNAS上的一项研究表明,语音识别程序对说黑人的人有偏见。平均而言,苹果(Apple)和微软(Microsoft)等领先科技公司的所有五个程序都显示出明显的种族差异;它们错误转录黑人扬声器音频的可能性是白人扬声器的两倍。

在与其他人的正常对话中,我们可能会选择代码转换,根据听众的不同,在语言、口音或说话方式之间交替。但对于自动语音识别程序,没有代码转换-要么你被同化了,要么你不被理解。这有效地审查了不属于用于创建这些技术的“标准”语言或口音的声音。

汤森大学(Towson University)技术交流与信息设计助理教授哈尔西恩·劳伦斯(Halcyon Lawrence)没有参与这项研究,他说:“除非我调整自己的语言模式,否则我无法与这些设备谈判。”“这是有问题的。”具体地说,问题不仅仅是必须改变你的说话方式:它意味着必须适应你的身份和同化。

对于有特立尼达和托巴哥尼亚口音的劳伦斯和其他人来说,我们身份的一部分来自于说一种特定的语言,有一种口音,或者使用一套说话形式,如非裔美国人白话(AAVE)。对于作为波多黎各人的我来说,用西班牙语说我的名字,而不是试图翻译声音,让北美的听众听得懂,这意味着要忠于我的根。劳伦斯补充说,必须改变身份的这样一个组成部分才能被认出,这本身就是残酷的。“就像人们不会想到我会脱下我的肤色一样。”

无法被语音识别程序理解会影响到其他边缘化社区。艾利森·科内克(Allison Koenecke)是一名计算机研究生,也是这项研究的第一作者,他指出了一个独特的脆弱群体:依赖语音识别和语音到文本工具的残疾人。“这只适用于能够被(自动语音识别)系统理解的人群中的一部分,”她说。对于残疾并依赖这些技术的人来说,被误解可能会产生严重的后果。

造成这些差异的罪魁祸首可能有很多,但科内克指出最有可能的是:培训数据。总体而言,用于训练语音识别技术的“标准”数据主要是白色的。通过在使用的词和如何说的词中使用狭窄的语音语料库,系统排除了口音和其他具有独特语言特征的说话方式,如AAVE。事实上,研究发现,随着AAVE使用的增加,误解的可能性也增加了。具体地说,研究中发现的差异主要是由于说话方式,因为即使说话者说的是相同的短语,黑人说话者被误解的可能性也是白人说话者的两倍。

此外,口音和语言偏见存在于创造这些技术的人身上。例如,研究表明,口音的存在会影响陪审员是否认定某人有罪,以及患者是否认为他们的医生称职。认识到这些偏见将是避免在技术中实现它们的重要方式。

加州大学洛杉矶分校(University of California,Los Angeles)信息研究副教授萨菲亚·诺布尔(Safiya Noble)承认,语言很难融入一项技术。“语言是与语境相关的,”诺布尔说,他没有参与这项研究。“当特定的身体说出某些单词时,它们的意思就是特定的东西,而这些(语音)识别系统并不能很好地解释这一点。”但这并不意味着公司不应该努力减少他们技术上的偏见和差距。然而,要做到这一点,他们需要理解人类语言的复杂性。因此,解决方案不仅可以来自技术领域,也可以来自人文、语言学和社会科学领域。

劳伦斯认为,开发人员必须意识到他们创造的技术的含义,人们必须质疑这些技术的目的是什么,以及这些技术为谁服务。要做到这一点,唯一的方法就是让人文主义者和社会科学家坐在谈判桌前,与技术专家对话,提出一些重要的问题,即这些识别技术是否可以被用作对付边缘化社区的武器,类似于面部识别技术的某些有害发展。

科内克说,从技术方面来说,向项目提供更多样化的培训数据可以缩小这一差距。她补充说:“我认为,至少增加非标准英语音频样本在训练数据集中的份额,将把我们带向缩小种族差距的方向。”诺布尔说,他们还应该更广泛地测试他们的产品,拥有更多样化的劳动力,这样来自不同背景和视角的人就可以直接影响语音技术的设计。

但双方都同意,科技公司必须承担责任,并应致力于变革。Koenecke建议自动语音识别公司将他们的研究作为初步基准,并继续使用它来评估他们的系统随着时间的推移。

有了这些策略,科技公司和开发者或许能够让语音识别技术更具包容性。但是,如果他们继续与人类语言和社会的复杂性脱节,而不认识到自己的偏见,就会继续存在差距。与此同时,我们中的许多人在与Alexa、Cortana或Siri互动时,将继续在身份和被理解之间挣扎。但劳伦斯每次都会选择身份:“我不会换的,我不会这么做的。”