脉搏血氧仪对深色皮肤的人会给出有偏差的结果。后果可能很严重。
新冠肺炎关怀把脉搏血氧仪带进了很多美国家庭。这种紧凑的医疗设备,只需20美元,就可以夹在指尖上,帮助测量有多少氧气进入血液。今年早些时候,当新冠肺炎发烧走访我家时,一切突然都围绕着小屏幕上的数字转了起来,屏幕上以百分比的形式报告了氧饱和度。正常读数在95%到100%之间;只有我熬夜确保他的读数不会再次下降到70华氏度,他才能睡得着。我们的医生说,如果设备的读数降到92就回医院,并呆在那里,但大多数晚上它都在那个边缘徘徊。我开始怀疑这个物体到底在告诉我们什么。
要想描述脉搏牛(医护人员这样称呼它)内部正在发生的事情,首先要想一想你的身体内部发生了什么。由于含有铁的血红蛋白,氧气饱和的血液呈鲜红色,它从你的肺部吸收气体分子,将它们输送到你的器官。在没有氧气的情况下,同样的血红蛋白会变暗成冰冷的紫红色。血氧计通过手指照射两种光--一种是红外线,一种是红色--来检测这种有色化学物质,然后感知另一边的光有多少。与脱氧血红蛋白相比,氧饱和血红蛋白吸收更多的红外线,也允许更多的红光通过。根据你的脉搏进行特定的技术调整,该设备每秒可以读出你血液的颜色几次。
然而,要“看到”你的血液,光必须穿过你的皮肤。这应该会让我们停下来,因为众所周知,一系列基于颜色传感的技术会复制种族偏见。例如,以白人皮肤为标准的摄影胶片通常会产生非白人的扭曲图像,直到20世纪70年代,其内置的假设开始被承认并重新设计;种族偏见的痕迹至今仍存在于摄影中。包括Fitbit在内的几种医疗设备也出现了类似的差异。我想知道,在血氧计的情况下,设计师是如何设法避免这样的问题的?当我更深入地挖掘时,我找不到任何记录表明这个问题曾经被完全解决过。今天市场上的大多数血氧仪最初主要是针对浅色皮肤进行校准的,它们仍然经常为非白人重现微妙的误差。
在医学界和科技界,有一种看法认为这种偏见没什么大不了的。为了了解原因,我联系了制造商、医生、研究人员和政府监管机构,要求对这些以前记录在案的问题进行任何更新。许多人的回应是这样的:“这些错误并没有真正得到处理,但这就是为什么它无关紧要的原因。”其他人认为,关于种族差距无害的故事揭示了恰恰相反的情况:已经正常化的不平等标准。这一切都很重要--错误、产生这些错误的历史、它们正在融入的未来,以及它们在美国科学和医学中揭示的关于种族主义的理由。
2005年,一组医生对血氧仪的种族偏见进行了极为详细的研究。该小组经常在著名的山顶缺氧实验室工作,该实验室由加州大学旧金山分校(UCSF)由血气分析发明人约翰·塞韦林豪斯(John Severinghaus)创立,他在麻醉学的医疗器械方面做了基础性工作。“在我们18年来测试脉搏血氧仪准确性的过程中,”研究小组在他们的文章中指出,“大多数受试者皮肤都很浅。。。。大多数脉搏血氧仪可能都是用浅色皮肤的人校准的,假设皮肤色素无关紧要。“。
但在听说黑人佩戴者存在一系列“无法接受的脉搏血氧饱和度错误”后,加州大学旧金山分校的这项研究“专门设计用来确定低[动脉血氧饱和度]的错误是否与肤色相关。”由于错误往往不会在健康的氧气水平下出现,因此需要一种特殊的方案来检查较低氧气水平下的准确性,这更好地模拟了实际的健康危机。医生们使用几个脉搏氧模型收集了一系列人的读数,然后将他们的读数与另一种基于动脉血气的测试进行了核对,这是氧气水平的“黄金标准”测试。(后一种方法更具侵入性,需要动脉供血,这就是为什么脉搏OX经常被用作医院的代用品。)。
研究小组在1067个数据点上交叉检查了这两个指标,发现了明显的错误模式。对于非白人来说,这些机器往往高估了几个点的饱和度水平。这项研究只包括那些认为自己是黑人或白人的参与者,但作者指出,在拉丁裔、土著和许多其他非白人中也观察到了不同程度的错误。TE
原则上,其影响可能会令人担忧。在我们第一次看到脉搏血氧饱和度的那天晚上,我丈夫在77岁醒来时吸了氧。在他们对低饱和度范围的研究中,加州大学旧金山分校的医生注意到“偏差高达8%。。。在深色皮肤的个体中,“错误”“在某些情况下可能相当严重”。因此,对于一个非白人来说,像我丈夫这样的77的读数可能隐藏着低至69的真实饱和度-甚至更大的直接危险。但是急救医生或入院护士在分诊期间可能无法检测到这些差异。这个数字看起来是客观的和种族中立的。
事实上,虽然血氧计是一些患者决定何时去医院的关键工具,但它也是他们在医院使用的。关于给氧的临床指导倾向于松散地按某个特定的氧饱和度阈值;例如,方案建议在88%、90%和92%进行特定的干预。在这些较高饱和度范围内的种族误差往往是1到4个百分点的较小差距,但如果没有被发现,它们仍然可能产生误导。另一项研究指出,在特定情况下,该差错“可能严重影响边缘病例的治疗决定”。
这可能看起来是一个很好的观点,但医学是由细微的观点组成的,这些细微的观点会变成普通的决定。使用加州大学旧金山分校的数据,一家公司的插图展示了三种品牌的脉搏血氧仪(Nonine、Nellcor和Masimo)在最常见的临床决策点之一的皮肤颜色变异性:读数为88%。脉搏血氧读数也会受到贫血、黄疸、血液循环不良和指甲油等条件的影响。诊所的医生可能无法区分潜在疾病引起的错误和设备对深色皮肤的偏见造成的错误。加州大学旧金山分校的实验室数据揭示了这一点。研究参与者是20多岁和30多岁的“健康、不吸烟”的黑人和白人年轻人,他们大多是加州大学旧金山分校的医科学生,他们都没有“肺部疾病、肥胖或心血管问题”。这组参与者使研究人员能够单独隔离肤色校准错误,消除由于潜在的共病造成的误读。
图片由诺宁医疗公司提供,图解了Feiner等人的发现。(2007)。NONIN技术简报,2008年9月。
大多数医院的方案现在建议从90岁开始吸氧。低于这一门槛,心脏、脑、肺和肾脏等重要器官的损害就成了迫在眉睫的危险。在混合的普通人群中,使用医院最常见的仪表,真正的血氧饱和度为88%,平均产生89至90的脉搏OX读数。在这种情况下,指南会正确地建议使用氧气。但是,同样处于危机中的88岁的黑人患者的平均读数为91-略高于干预门槛。
医生们对这些差异的临床意义意见不一。轻微的种族错误在实践中真的很重要吗?与任何生命体征一样,脉搏血氧饱和度读数是做出重症监护决定时考虑的众多因素之一。我采访的大多数护理人员都注意到,仔细观察的护士或医生会利用他们接受的一系列其他信息,利用他们的培训来挑选模式,并将数字放在更广泛的背景下,并结合患者感知到的痛苦感觉。一位重症监护专家告诉我,她认为加州大学旧金山分校的研究发现的错误不会改变她工作的地方皮肤较黑的患者接受的护理。我可以想象,在她这样的特定病例中,这可能是真的,但在她的医院,没有人收集到关于这个话题的令人放心的证据-更不用说全国或全球-所以我发现自己盯着唯一可用的系统数据令人不安的图表,因为她讲述了她将如何将这些读数与背景联系起来的轶事。我挂断了电话,对她的话感到不安:“通常”这不会有什么问题,她说。她的洞察力帮助我形成了一个更难以捉摸的问题:那些通常落在外面的时刻怎么办?
根据我今年春天的亲身经历,当我呼吸困难到达急诊室时,医院的脉搏OX读数正好是91。有人告诉我,90岁左右可能意味着我需要氧气,而91岁意味着观望。这似乎是使用中的经验法则,尽管它看起来并不是一成不变的。我没有接受动脉血气测试之类的检查。这样的程序在重症监护病房更常见,但今天95%的冠状病毒感染者从未去过那里。我周围的急诊室护理团队似乎在非常仔细地查看脉搏氧饱和度。他们对与新冠肺炎有关的“快乐缺氧”持谨慎态度。不久,我的氧气上升了几个点,我被送回家,仍然呼吸困难,现在被指示继续隔离,并购买脉搏氧。我是白人,这些电话很管用
与我交谈过的一些护理人员听起来疲惫不堪,想回答有关脉搏氧偏倚的问题。毫无疑问,他们受到了上千个新冠肺炎偶然性事件和更明显的不平等表现的困扰。即使他们从来没有注意到故障,想知道也可能是痛苦的。与我交谈的其他人认为,任何根本的种族差异都是不可接受的。当人们依靠设备来拍照时,就像柯达胶卷一样,难道每个人的照片不应该都一样清晰吗?任何不平等都会扩大犯错误的空间,这些错误可能会放大现有的不平等。这造成了一种情况,医院护理团队需要解决他们工具中微妙的种族偏见。
“种族主义在这里是如何运作的?”内科医生、流行病学家和民权活动家卡马拉·菲利斯·琼斯(Camara Phyllis Jones)敦促卫生从业者在整个工作过程中都要问这个问题。在脉搏血氧仪的情况下,轻微的误差比其他情况下的意义要大得多,因为他们插入的医院中无意中存在着更大的种族主义模式。非白人患者已经更有可能有相同的体征,被医生归类为不那么紧急,几十年的研究记录了无意的医疗种族主义。错误地表明住院患者比他们更安全的测量错误可能会进一步导致次优治疗。正如照顾者所说,“任何基于隐性偏见的决策都是有害的”,因为“一个不正确的假设可能从字面上意味着生与死的区别。”
例如,在新冠肺炎测试不可靠的问题中,一些有色人种患者报告说,医生将他们的呼吸困难归因于焦虑。事实上,美国医学院协会(Association Of American Medical College)以打击急诊室已知的治疗差异的名义,建议医院“尽可能多地取消个人自由裁量权”,而是寻求“客观措施”来帮助医生克服“提供者甚至不知道自己拥有的隐性偏见”。在现实中,如果脉搏氧饱和度等看似客观的指标本身显示出隐藏的种族偏见,这项政策可能会进一步放大问题。当克服医生偏见的努力依赖于也有偏见的设备时会发生什么?
最重要的是,脉搏OX数据是一个关键的重要迹象,它被输入到越来越多地指导医院决策的算法中。正如“自然”和“科学”杂志报道的那样,许多算法已经表明,按照有模式的种族划分,护理不足:平均而言,有色人种患者必须病情更重,才能接受与白人患者相同的干预。他们不太可能被及时识别为ICU入院,即使他们的档案在其他方面是相同的。然而,像史诗般的“恶化指数”这样的算法工具只能渴望和输入数据的工具一样好。有了PULSE OX差异,机器从这些扭曲的输入中学到了什么?专有的史诗早期预警方程纳入了罗斯曼指数,该测量中内置的8个氧饱和度截止数字中有一半在种族错误的范围内。就像其他地方算法的“编码凝视”所放大的问题一样,即使是很小的种族差异也可能放大不平等的输出。
除了Pulse OX本身,这对其他可穿戴的彩色设备和它们提供的算法也很重要。假装他们是色盲可以进一步放大“种族主义,而不是遗传学,解释了为什么美国黑人死于新冠肺炎。”我打电话给麻省理工学院小设备实验室的同事Jose Gomez-Marquez,他的研究涉及撬开设备以了解它们的内部工作原理。他总是知道最新的医疗技术传闻,我想问问最近是否有一些关于重新校准血氧计的内幕消息。是否有一些安静的种族正义工作已经纠正了它的偏见设计?
“据他所知没有,”何塞说。血氧仪早在几十年前在欧洲、北美和日本发展起来的DIY数字医疗技术场景之前。在今天的制造商中,与大多数集团争夺声望突破和有利可图的市场的尖端领域相比,这款设备通常被认为是简单到了儿童游戏的地步。
正如科技社会学家鲁哈·本杰明(Ruha Benjamin)所说,对于由“歧视性设计”塑造的设备来说,非故意的不平等仍然会产生模式化的排斥和不平等的存活率。加州大学旧金山分校的医生记录了这些差异,他们建议在未来的模型中设计“内置的用户可选的调整”。但十多年后,我在市场上找不到任何例子。医生们还总结说,至少,“应该向使用者提供警告标签,可能会有建议的校正系数。”我检查了我的脉搏牛收到的盒子,但上面只有细小的字体,上面写着与深色NA有关的不准确信息。
PULSE OX制造商诺宁早在本世纪头十年就试图解决其设备中基于种族的错误。他们网站的一个页面解释了他们与规模更大的竞争对手相比,到目前为止的工作。最初研究中的其他几家公司也很客气地回答了我的问题,但没有一家公司提供的数据表明问题已经得到解决。我梳理了他们为寻找背景而指出的已发表的研究。被引用最多的是2017年的一项研究,几家公司提出这项研究是一个亮点,表明血氧仪读数在35名婴儿中没有种族偏见。(其他研究表明,婴儿的黑色素产量较低,新生儿皮肤的微结构要薄得多,这使得他们不太容易受到色度测量的种族偏见的影响。)。对于婴儿重症监护病房来说,这是一个令人欣慰的消息,但它并没有告诉我们,其他人已经修复了设备错误:研究本身指出,成年人之间存在着明显的差异。
一家最大的制造商表示,他们有一个特定型号的令人放心的内部数据,但这种反应让我怀疑他们今天卖给医院的其他许多型号。公司应该创建面向公众的记录和全球历史记忆,记录已经发生的任何此类纠正工作,在我们的医疗系统私有化拼凑的幕后,让我们所有人都清楚地知道事情的现状。毕竟,这些都不是新问题:虽然新冠肺炎对脉搏OX给予了新的强调,但该设备长期以来一直是治疗呼吸疾病的关键,因为他们自己在诊断和护理方面有慢性种族偏见的历史。
目前,医生们似乎也几乎没有就如何看待现有的研究达成共识,包括2019年教科书中引用的那些关于需要纠正设备种族错误的研究。1990年以来仍在转载的一项这样的研究重新统计了数据,数据显示,用于戴呼吸机的白人患者的脉搏OX靶标92,通常会导致黑人患者缺氧;对于这一患者组,脉搏OX读数95对应于动脉血气读数92。然而,我咨询过的几位医生说,即使是在1990年,他们也从未了解过这一点。卫生保健提供者是否应该意识到这些重大错误,或者是教科书教给医生的是过时的纠正,这些纠正也可能导致混乱或错误的调整,从而产生潜在的危害?公司应该是透明的,在他们的网站上评估和澄清任何种族偏见的边际,因为在任何一个方向上做错了都可能放大种族护理差异。
在此之前,脉搏牛可以被解读为系统性种族主义的一个缩影-正如人类学家所指出的那样,在这种联系中,黑匣子和公共秘密往往是齐头并进的。由于加州大学旧金山分校最初的研究以呼吁采取行动而结束,在医学文献中以及在当前大流行的轮廓内追踪其来世是令人不安的。后来的研究引用了加州大学旧金山分校的研究结果,经常暗示非白人的身体应该为设备的故障负责。最近一次。
.