冠状病毒喜欢人群。把足够温暖、敏感的身体放在一起,它肯定会传播的。科学家们从疫情几乎开始的时候就知道,从对新冠肺炎的研究开始,在韩国的一个大城市里,在意大利的一场冠军联赛足球比赛中,钻石公主号游轮上爆发了疫情。从那以后,无数的其他星团被记录下来,通常是由一个有传染性的个体播种的。
正是人群的危险导致其他国家的政府实施了全国性的封锁。在美国,这更多的是州和地方的全职命令、学校关闭和大规模集会禁令的拼凑。随着科学家们对可能导致这种超级传播事件的特定条件有了更多了解-裸露面具的人在通风不良的室内空间交谈、唱歌或锻炼-从理论上讲,这使得微调这些疾病控制策略成为可能,并放松最戏剧性的限制,将重点放在最有效地阻止病毒传播的政策上。
但人们也喜欢拥挤的人群。在春末和夏天,一些群众集会-通常是媒体、医疗保健专业人员和忧心忡忡的邻居焦急地观看-变成了现实生活中的实验,看看在新冠肺炎时代,当你把人们放在一起会发生什么。这些活动从非政治活动(春假、夏令营、返校)到政治热潮(特朗普总统的塔尔萨集会、“重开”抗议活动、反警察暴行抗议活动,以及波特兰正在进行的反对使用联邦特工的示威活动)不一而足。每一项测试都测试了不同的变量-口罩与不戴口罩,室内与室外-但都引发了研究相同问题的机会:有多少人会因此生病,有多少人会死亡,以及谁会承担医保账单的费用?
弄清楚这类事情对于政府和想要对他们将允许或参与的活动类型进行知情的风险收益计算的人来说是至关重要的。在美国,由于其对大流行的政治两极分化反应,人们对这一信息也出于另一个原因而坐立不安。双方都在寻找对方行为不负责任或虚伪的证据,密切关注谁在全国死亡人数中增加了更多的数字。
这就是为什么像本周发布的一项研究,测量了南达科他州斯特吉斯摩托车拉力赛对新冠肺炎变速器的影响,导致了这样一种确认偏见助长的社交媒体分享狂潮。圣地亚哥州立大学(San Diego State University)健康经济与政策研究中心(Center for Health Economics&;Policy Studies)的四名研究人员在一篇非同行评议的工作论文中,分析了整个夏天在美国各地收集的匿名手机数据,看看斯特吉斯在美国哪里吸引了近50万名参与者。然后,他们跟踪了在8月份事件发生后的几周内,参加集会人数较多的县的新冠肺炎病例率发生了什么。他们将这些所谓的高人流量地区与人口统计相匹配的“综合”县进行了比较。需要澄清的是,合成县是真实存在的;它们是美国的一些地方,它们具有与高流动县相似的特征-人口结构、新冠肺炎的传播率和趋势,以及疾病缓解政策。研究人员的模型假设,他们唯一的不同之处在于,这些县的一群居民没有花一周的时间在南达科他州的山上狂欢。这就是他们成为控制者的原因。
该报告的四位合著者之一约瑟夫·萨比亚(Joseph Sabia)说:“如果这一事件没有发生,我们无法观察到会发生什么。”“因此,我们对另一个宇宙的样子做出了最好的估计。”
研究人员采用增量-每个县与其对照之间的发病率差异-并将其乘以每个县在集会前积累的总病例。然后他们把所有这些加起来。换句话说,这需要大量的数学运算。考虑到这是一项经济研究,而不是流行病学调查,这并不令人惊讶。但仍然需要注意的是,作者没有使用接触者追踪或病毒株基因分析等方法来确定不同国家的人实际上感染的地方,以及他们是否真的都携带相同的病毒株(或多个株),这是你对在一次事件中都接触过病毒的人的期望。
正是使用这种以数学为中心的方法,研究人员估计,这一反弹导致全国新增病例超过26万例-占2020年8月2日至9月2日期间美国记录的140万新感染病例的19%。更重要的是,他们给所有这些额外估计的感染打上了价格标签:在医院费用和工作场所生产力损失之间,高达122亿美元。
萨比亚说:“如果所有的风险和医疗费用都由参会者承担,我将是第一个支持他们有权选择参加斯特吉斯这样的活动的人。”但对于传染性疾病,这些风险和成本不可能被如此巧妙地控制。这就是他和他的同事们认为像他们进行的那样的分析的作用-权衡举办大型集会的经济效益和如果参会者生病所造成的损失。目标是什么?确定在保护社区的同时对当地经济造成最小打击的缓解战略。
只有一个问题。在美国,要量化大型集会对新冠肺炎传播的影响所需的数据根本不存在。未能建立健全的测试和接触者追踪计划,以及数据报告系统,已经确保了这一点。这场信息灾难让研究人员不得不从一大堆较弱、不太直接的证据中寻找解释。像萨比亚团队开发的计量经济学模型,不仅是为了估计斯特吉斯的影响,也是为了估计特朗普总统的塔尔萨集会、黑人生命也是命的抗议活动,以及威斯康星州最高法院废除该州居家令的决定,因此必然依赖于增加大量噪音和不确定性的代理措施。
这是因为看似最明显的衡量标准-确诊病例的数量-并不像你想象的那么直接或可靠。在美国,检测通常仍是定量配给的,据信确诊病例将真实感染率低估了5到10倍。这意味着它们是对正在进行多少检测以及谁正在接受检测的衡量标准,而不是对真实感染率的直接衡量。
加州大学圣地亚哥分校(UC San Diego)社会科学机器学习实验室(Machine Learning For Social Science Lab)主任、社会科学数据建模专家雷克斯·道格拉斯(Rex Douglas)表示:“确诊病例是一项粗略的替代指标,旨在让政策制定者看到大趋势,并就呼吸机或病床等资源的放置做出短期决定。”但是,确诊病例数量-以及在大规模事件后它们是如何变化的-不能提供关于感染率变化的良好信息。他表示:“尽管斯特吉斯很可能将新冠肺炎传染出去的粗略结论几乎肯定是真的--如果是真的,那就令人震惊了--但他们使用的研究设计无法确切地告诉我们传播到何种程度。”
你知道一句谚语-坏数据进来,坏数据出来。那么,当人们(和头条撰稿人)以表面价值看待这些结果时,麻烦就来了。萨比亚的团队发表的每一篇论文都给处于不同政治光谱两端的人们提供了他们想要听到的东西。与斯特吉斯集会形成对比的是,研究人员没有发现其他大规模集会的影响,包括黑人生命也是命的抗议活动和特朗普的塔尔萨集会。萨比亚说,这可以用它们是较小的事件来解释。或者,在抗议活动中,因为大多数人都戴着口罩。或者,在塔尔萨的情况下,因为手机数据显示,在事件发生前后的几天里,该市居民更多地呆在家里,要么是出于对传染或暴力的恐惧。但这些只是假设。研究设计本身几乎没有阐明新冠肺炎从这些事件中传播的实际原因,甚至风险。
道格拉斯表示:“政策制定者和选民都需要知道,我们仍然无法用手头的工具回答有关这场流行病的最基本问题。”道格拉斯一直在Twitter上直言不讳地批评这类研究,比如本周发表的关于斯特吉斯的研究,并与人合著了一篇即将发表的论文,内容是关于迅速膨胀的Covid文学中的类似缺陷。而且他并不孤单。其他科学家也担心,急于使用糟糕或不完整的数据来提供关于大型集会影响的答案,任何答案,最终都不会对结束这种大流行起到什么作用。事实上,他们认为这可能比根本没有答案更有害。
“看,这些确实是我们需要解决的紧迫问题,”内科医生、健康研究员、最近被任命为布朗大学公共卫生学院院长的阿西什·贾(Asish Jha)说。“我们需要能够仔细分析有多少抗议、集会和其他事件导致了疾病爆发。但是,比起快速完成分析,更重要的是立即完成分析。在这种情况下,它只是做得不够好。我希望作者们在知道当时的政治环境是多么不稳定的情况下,能多做些细心的工作。“。
事实上,南达科他州的官员很快就拒绝了这位研究人员的发现。该州卫生部的一位发言人在一封电子邮件中告诉“连线”杂志,这项研究“与我们在当地看到的影响不一致。”州长克里斯蒂·诺姆(Kristi Noem)是一名共和党人,他一直回避口罩授权和其他疾病预防措施,他走得更远,告诉福克斯新闻,研究人员“做了一些b
现在,那是它自己的另一个宇宙。圣地亚哥州立大学团队采用的广为接受的方法是经济学家在试图回答关于突发事件的社会影响的问题时使用的标准方法。但这并不意味着它们是回答这个问题的正确方法,也不意味着这项研究没有缺陷。特别是,JHA对缺乏所谓的证伪分析提出了异议。这些测试是检查您的工作的一种方式,以确保它测量的是您认为的东西。要做到这一点,一种方法是想象这样一个世界,涨势比实际发生的时间提前三周,然后再次运行模型。如果反弹(实际的反弹)真的是推动冠状病毒激增的原因,那么使用这个虚构的斯特吉斯日期进行分析应该不会发现病例比率有任何变化-因为在这种分析中,真正的反弹仍然是未来三周后。如果你确实看到了变化,那么你就知道除了斯特吉斯反弹之外,还有其他因素导致了涨幅。如果没有这些检查,就更难得出因果关系的索赔。
但Jha说,更大的问题是,现实世界的数据似乎与研究的估计不符--除了南达科他州。到目前为止,该州卫生部门已经确认了参加集会的124人,后来对新冠肺炎的检测呈阳性。该部门的一位发言人拒绝透露这些人中有多少密切接触者目前正在接受监测,看看他们是否生病。但在反弹之后的一个月里,南达科他州的日平均新诊断病例从82例增加到307例,增加了两倍多。Jha说,这是一个明显的峰值,在时机上与斯特吉斯排得很好。
然而,根据手机数据,90%的集会参与者来自该州以外的地方。然而,当你看到斯特吉斯研究作者确定的与会者人数最多的县时,你没有看到类似的激增。根据他们的模型,在集会之后的三周内,新冠肺炎感染人数上升最多的地方是亚利桑那州马里科帕县、明尼苏达州亨内平县和科罗拉多州丹佛大都市区周围的三个县。在这些县,作者发现斯特吉斯的反弹与新冠肺炎病例增加13.5%有关。但根据州公共卫生部的数据,马里科帕县实际上每天报告的病例有所下降-从集会开始时的7天平均775例下降到一个月后的266例。在科罗拉多州的三个县中,有两个县的新病例数量在反弹后下降或持平。在其他一些高流量县也观察到了这一趋势,包括洛杉矶的圣地亚哥和拉斯维加斯所在地内华达州的克拉克县。
一个例外是明尼苏达州,该州上周报告了第一例与斯特吉斯有关的新冠肺炎死亡病例。明尼苏达州卫生官员告诉连线,到目前为止追溯到斯特吉斯的51例病例是最近感染人数上升的原因之一。(目前还没有按县分列的数据。)。
当被问及这项研究的估计与这些县的病例比率之间的差异时,萨比亚说,这些数字不仅仅来自这几个司法管辖区。“影响是分散的,遍及美国各个角落的数百个县,”他说。
杰哈不会买的。“可能不在那些县,但在哪里呢?”他问。“你可以仅仅因为吵闹而隐藏5%或2%的涨幅。但是他们说20%的病例--这是一个巨大的影响。在美国,这是五分之一的病例。你不能就这样把它埋在几个小县城里却看不到隆起。这就是为什么对我来说,他们的说法是不可信的--过去三周有25万起案件没有通过嗅探测试。“。
约翰霍普金斯大学的传染病流行病学家贾斯汀·莱斯勒(Justin Lessler)更倾向于认为这个估计,如果至少不可信的话,用他的话说,“并不完全疯狂”。他持怀疑态度的原因还可以归结为正在使用的方法过于拥挤。选择同等的县作为你的控制点是一件棘手的事情。可能没有完全匹配的。在你正在研究的事件之前,传播动力学上的微小差异可能会以很大的方式扭曲结果-以至于完全错误。莱斯勒说:“因为在你如何做到这一点上存在所有这些潜在的陷阱,所以这是一种较弱的推理形式。”“在这种情况下,预估也有很高的不确定性。”
然而,莱斯勒说,考虑到现有的数据,这种分析是你唯一能做的事情,因为没有办法看到人们不去斯特吉斯的现实版本。对每个参加集会的人进行测试,并追踪他们可能接触到的每个人,对于美国拼凑起来的接触者追踪行动来说,这是一项过于庞大的任务。也许它本可以由更具侵扰性的政府来处理。
Sabia同意,虽然不完美,但这样的分析在填补零散和不堪重负的接触者追踪工作留下的信息空白方面可以发挥作用。萨比亚说:“在我看来,盲目做出可能导致超级传播事件的重要政策决定,并不比使用可能有一定局限性的数据更可取。”
另一方面,来自社会科学实验室的机器学习的道格拉斯说,仅仅因为可以进行这种类型的分析并不意味着应该这样做。他担心的是,因为这项研究已经存在,我们永远不会得到一个很好的、真正的答案,即有多少感染是从斯特吉斯集会或其他大规模集会中产生的。同样的逻辑也适用于使用同样薄弱的方法来衡量戴口罩、呆在家里的命令和其他旨在减缓疾病传播的干预措施的有效性的研究。
例如,6月份发表的一项覆盖面很广的研究得出结论,口罩是控制冠状病毒传播的最有效手段。它被广泛分享为每个美国人都应该戴口罩的证据,直到数十名统计专家开始呼吁立即收回这一口罩。他们指出,虽然口罩几乎肯定能防止新冠肺炎的社区传播,而且弄清楚口罩对公共健康有多大的帮助是紧迫的,但这项特殊的研究并不是为了回答这个问题。这一事件促成了今年关于戴口罩重要性的含混信息的传奇故事。
问题仍然是缺乏关于有多少人得到了新冠肺炎的准确数据。除非我们对检测的可用性在不同时间、地区和人口统计学上的变化有一个很好的了解,否则研究人员不能确定感染率也有多大的变化。道格拉斯说,人们可以合理地使用贝叶斯技术来做出一些合理的猜测,但即使这样,假阳性率和测试结果周转时间的延迟也可能会搞砸。“这里一团糟,”他总结道。
为了扭转这种情况,他希望看到美国投资于定期的、大规模的检测,比如英国国家统计局的新冠肺炎感染调查,该调查每两周为28,000名英国人提供免费的诊断和抗体测试。参与者将症状记录在应用程序上,并被跟踪至少一年。该机构最近宣布了到10月份将规模扩大到15万人的计划,目标是达到40万人。
在德国,定期擦拭、血液测试和问卷调查使研究人员能够更准确地捕捉户外嘉年华超级传播事件的影响。他们发现,参加这一活动的人感染的几率增加了一倍多。
但是,如果似乎已经有了好的答案,美国的政策制定者和研究资助者可能更难证明这些类型的长期、全民实验的资源是合理的-尽管随着抗议活动升级、音乐会和足球比赛恢复,以及政府试图安全地在11月举行全国大选,这个问题只会变得越来越重要。
道格拉斯说:“在完全缺乏证据的情况下,社会对答案的极端需求的一个反常后果是,答案无论如何都会从乙醚中浮现出来。”他表示,政党、政府机构、媒体和大多数其他机构完全愿意满足市场对自信答案的需求,无论它们是否有根据。但作为一种交易,科学意味着抵制这种诱惑,接受无知,耐心地、有时还会痛苦地进行渐进的工作。正如他所说:“这就是工作。”