估计美国未观察到的SARS-CoV-2感染情况

2020-08-23 23:42:27

编辑:Nils Chr.。Stenseth,挪威奥斯陆大学,2020年7月21日批准(2020年3月24日收到供审查)。

到2020年3月,新冠肺炎导致数以千计的人死亡,并扰乱了全球的经济活动。由于病例定义狭窄,检测能力有限,严重急性呼吸综合征冠状病毒2型(SARS-CoV-2)在最初入侵美国期间未被观察到的感染人数仍不得而知。我们开发了一种方法,基于新传染病出现后不久通常可以获得的数据,估计未观察到的感染人数。我们方法的逻辑本质上是,在输入病例开始出现后的最初几周内,可能发生的新感染指数增长的数量是有限度的。将这一逻辑应用于截至3月12日的美国输入性病例和当地死亡数据,我们估计到这一日期,美国发生了108,689例感染(95%后验预测区间[95%PPI]:1,023至14,182,310)。通过将模型对症状性感染的预测与随时间推移报告的当地病例进行比较,我们获得了监测检测到的症状性感染比例的每日估计值。这表明,由于感染的指数增长超过了检测的增长,症状感染的检测在整个2月份都有所下降。在2月24日至3月12日期间,我们估计症状性感染的检出率有所增加,这与检测的增加密切相关(中位数:0.98;95%PPI:0.66至0.98)。这些结果表明,在SARS-CoV-2最初入侵美国期间,检测是评估SARS-CoV-2传播程度的主要限制因素。

严重急性呼吸综合征冠状病毒2(SARS-CoV-2)是一种新出现的引起全球大流行的冠状病毒(1)。SARS-CoV-2的空前传播归功于其高传播性(2)、无症状传播(3)和无症状感染传播(4)。相当一部分感染是无症状的(5),其他许多感染会导致轻微的症状,可能会被误认为其他呼吸道疾病(6)。这些因素表明潜在的大量未观察到的感染(7),特别是在检测SARS-CoV-2能力有限的环境中(8)。美国就是这样一个国家,在那里,有限的检测是一个主要问题,特别是在输入病例和随后在2020年初随着时间的推移本地病例增加的情况下(9)。在2月27日之前,美国的检测标准仅限于确诊病例的密切接触者和最近去过中国的人(9)。这意味着,任何由未被观察到的输入感染引起的本地感染都不会被注意到。社区传播在没有通知的情况下发生,而检测仍在进行中(10,11),尽管程度未知。

我们的目标是估计SARS-CoV-2在广泛认识之前在美国发生的社区传播程度。与其他积极采取检测和遏制措施的国家不同(12,13),美国的检测推广速度很慢(9),广泛的社会疏远措施直到第一例报告病例后几周才生效(14,15)。了解社区传播的程度对于控制不同选择的有效性(16)以及预测大流行的轨迹和影响具有重大意义(17)。

为了估计SARS-CoV-2在美国的社区传播程度,我们使用了一个结合输入和本地传播过程的随机模拟模型。我们将流行病学研究中对这些参数的估计值告知模型参数(表1),并通过将我们的模型与美国当地报告的死亡数据进行拟合来估计两个未知参数的值(18)。为了模拟输入,我们根据美国报告的输入病例的数量和时间(19),以及关于不同感染结果比例的假设(5,20),模拟了观察到的和未观察到的输入感染。为了模拟局部传播,我们使用了一个分支过程模型,该模型由荟萃分析(21)的复制次数估计和中国一项研究(22)的序列间隔估计提供信息。为了将我们模型的预测与美国报告的病例和死亡数据联系起来,我们还模拟了发生这些结果的模拟感染的症状出现时间(22例)、病例报告时间(18例)和死亡时间(23例)。

截至3月12日,美国共有1514例报告病例和39例报告死亡,这些病例是由当地传播的SARS-CoV-2引起的。我们使用这些信息通过播种来估计检测到输入性症状性感染(ρ旅行)的可能性。

我们的模型对累积死亡的适合性是通过其对截至3月12日的局部死亡的预测来评估的(中位数:35;95%的购买力平价:1到983),这与根据模型预测的中心趋势报告的39人是一致的(图3)。与我们分析的其他方面一样,由于随机性和参数的不确定性,我们对累积死亡人数的预测存在广泛的不确定性。因为我们的模型只适用于累积死亡人数,所以没有任何关于死亡时间的信息,除了这些死亡发生在3月12日之前。即便如此,我们的模型预测的死亡人数中有95.5%发生在报告当地死亡人数的同一天数范围内(2月29日至3月12日)。总体而言,这表明我们的模型关于输入时间、本地传播以及接触和死亡之间的延迟的假设是合理的。由于新冠肺炎造成的死亡通常发生在暴露几周后(34),我们的基线模型预测3月12日之后由于感染而额外死亡的中位数为827人(95%购买力平价:6到115,707人)。与当时报告的死亡人数相比,这意味着增加了21倍(95%购买力平价:0.18至2965)。这个结果在我们的敏感性分析中总体上是稳健的,除了如果序列间隔长或死亡时间短,这个比率的极高值被排除在外(SI附录,图。(第8条)。

我们的方法使用一个数学模型来利用现有的数据来回答一个在美国新冠肺炎大流行的初始阶段对公共卫生非常感兴趣的问题。应用这一方法的唯一要求是基本流行病学数据和标准流行病学参数的估计,这两者都是在流行病初期的最初几周例行收集的。虽然其他方法--即血清学调查--本可以更直接地回答在SARS-CoV-2到达美国后的几周内有多少未观察到的感染的问题,但血清学分析在当时才刚刚开始发展(35)。即使现在血清学调查的结果开始出现(36),它们仍然没有解决我们分析的特定时间框架内未观察到的感染的程度,不能代表整个美国,而且可能对分析性能中的微小不准确很敏感(37,38)。与其他方法相比,我们的方法提供了在疫情早期快速获得未观察到的感染数量的临时估计的能力,此时可能仍有时间对这些信息采取行动,进行检测和病例隔离。

我们结果的一个突出特点是不确定性。虽然更准确的估计会更可取,但重要的是要认识到我们试图解决的问题本质上是不确定的。在识别新出现的病原体的头几个月里,提供模型信息的数据很少,与传播和疾病表现相关的参数有相当大的不确定性,关于病原体生物学基本方面的主要未知因素(39,40)。我们的方法提供了一种方法,从不同的研究中综合不确定性的多个方面,以解决一个重要的问题,而更直接的、经验性的方法对这个问题没有明确的答案。我们的一些结果提供了比其他结果更清晰的信息。一方面,我们无法解决我们在分析过程中估计的两个参数中的大部分不确定性:ρ出行和α。这是因为,这些参数的许多不同组合同样能够解释截至3月12日的39例死亡,特别是考虑到我们没有估计的其他参数的广泛不确定性。另一方面,我们的结果认为,截至3月12日,美国本地感染人数的概率很高(0.825),至少比报告的病例数量多一个数量级,很可能(概率为0.515)两个数量级或更多。我们对未观察到的感染人数估计的更高精确度不会改变我们的总体结论,即在3月13日宣布全国进入紧急状态之前,美国严重低估了SARS-CoV-2感染的报告。

除了与我们的结果相关的不确定性之外,我们的分析还有其他应该承认的局限性。首先,我们的分支过程模型假设指数增长,这可能会受到社会距离(41)或免疫力增强(42)的影响。然而,在3月13日之前,这两个因素似乎都没有对SARS-CoV-2在美国的本地传播产生太大影响(43)。其次,我们的参数假设主要基于对美国以外收集的数据的分析。类似的信息已被证明是有用的

我们考虑导入MIDAS数据集中与国际旅行相关的案例。由于从钻石公主号游轮遣返的SARS-CoV-2阳性人员已被隔离(53人),我们将他们从我们的分析中删除,留下153例输入性病例(包括1例死亡)。我们根据无症状比例、σ、病死率(Cfr)和检测到输入性症状性感染的概率(ρ旅行)来估计输入性感染的数量。未观察到的输入感染数量的概率U,连同观察到的152个病例C和一个观察到的死亡病例D的概率被计算为多项式概率Pr({U,C,D})=(U+C+D)!你!C!D!Pr(U)U Pr(C)C Pr(D)D,[1]。

其中pr U=σ+1−σ 1−ρTravel 1−cfr[2a]pr C=1−σ ρTravel 1−cfr[2b]pr D=1−σ cfr。[2C]。

在给定值C=152和D=1的情况下,对于介于0和20,000之间的U值计算Pr({U,C,D})之后,我们使用R中的样本函数对U进行与Pr({U,C,D})成比例的采样。这产生了U的后验样本,条件是C和D的观测值。然后,我们用高斯核平滑了已知输入感染的日期,并对该分布中所有U+C+D输入感染的采样日期进行了平滑。

我们模拟了1月1日至3月12日在美国的本地传播,使用由输入性感染播种的分支过程模型。分枝过程模型中每次感染产生的继发感染数取自负二项分布,平均R和离散度参数为k。无症状个体产生的继发感染数也取自负二项分布,但具有平均αR,其中α在[0,1]。从对数正态世代间隔分布中提取每一次继发感染的暴露时间。在这样做时,我们假设世代间隔遵循与串行间隔相同的分布。

除了曝光之外,

.