严重Covid-19的主要遗传危险因素是从尼安德特人那里继承的

2020-11-27 03:11:43

最近的一项基因关联研究1将3号染色体上的基因簇确定为感染严重急性呼吸系统综合症冠状病毒2(SARS-CoV-2)后发生呼吸衰竭的危险位点。另一项研究(COVID-19 Host Genetics Initiative)2包括3199名2019年患冠状病毒病的住院患者(COVID-19)和对照个体,表明该簇是SARS-CoV-2感染和住院后严重症状的主要遗传危险因素。在这里我们表明,这种风险是由从尼安德特人(Neanderthals)继承的大约50个千碱基的基因组片段赋予的,由南亚约50%的人和欧洲约16%的人承担。

迄今为止,COVID-19大流行已引起相当大的发病率和死亡率,并导致超过100万人死亡。3由病毒SARS-CoV-2引起的疾病的临床表现,其严重程度差异很大,范围不等。从无症状或轻度症状到迅速发展为呼吸衰竭4.在大流行初期,很明显,高龄是主要的危险因素,也是男性和某些合并症。5.但是,这些危险因素并没有充分解释为什么有些人没有症状或症状较轻而另一些人症状较严重。因此,遗传危险因素可能在疾病进展中起作用。先前的一项研究1确定了与严重COVID-19相关的两个基因组区域:3号染色体上的一个区域,其中包含6个基因; 9号染色体上的一个区域,确定了ABO血型。最近,COVID-19主机遗传学计划发布了一个数据集,其中3号染色体上的区域是在全基因组水平上与严重COVID-19显着相关的唯一区域(图1a)。该地区的风险变异使需要住院的比值比达到1.6(95%置信区间为1.42-1.79)(扩展数据图1)。

a,曼哈顿全基因组关联研究的3,199例COVID-19住院患者和897,488人口对照的曼哈顿图。虚线表示全基因组意义(P = 5×10 -8)。数据来自COVID-19主机遗传学计划2(https://www.covid19hg.org/)。 b,“ 1000基因组计划”中的指数风险变量(rs35044562)与遗传变量之间的连锁不平衡。红色圆圈表示遗传变异,其中等位基因与风险变异相关(r 2> 0.1),风险等位基因与Vindija 33.19尼安德特人基因组匹配。中心的尼安德特人单倍型(r 2> 0.98)用黑条表示。一些个体携带更长的尼安德特人式单倍型。下面使用标准基因符号指示基因在该区域中的位置。 x轴显示hg19坐标。

与第3号染色体上的严重COVID-19最相关的遗传变异(45,859,651–45,909,024(hg19))均处于高度连锁不平衡(LD)中,也就是说,它们在人群中彼此之间密切相关(r 2 > 0.98)-跨度为49.4千个碱基(kb)(图1b)。此外,这种“核心”单倍型处于较弱的连锁不平衡状态,具有更长的单倍型,最高可达333.8kb(r 2> 0.32)(扩展数据图2)。一些这样的长单倍型已经通过尼安德特人或丹尼索瓦人的基因流进入了人类种群,这些灭绝的人类素在大约40,000-60,000年前的6、7日为当今人类的祖先贡献了遗传变异。因此,我们调查了单倍型是否可能到来来自尼安德特人或丹尼索瓦人。

两项研究1、2的指数变量在非非洲人群中处于高连锁不平衡状态(r 2> 0.98)(扩展数据图3)。我们发现这两个变体的风险等位基因均以纯合子形式存在于Vindija 33.19 Neanderthal的基因组中,Neanderthal是大约50,000岁的来自南欧克罗地亚的Neanderthal,在构成核心的13个单核苷酸多态性中单倍型,在Vindija 33.19尼安德特人中以纯合形式出现(图1b)。这些变体中的三个发生在阿尔泰9和Chagyrskaya 8 10尼安德特人,它们都来自西伯利亚南部的阿尔泰山脉,分别约有120,000和60,000年的历史(扩展数据表1),而没有任何变体发生在Denisovan基因组11中。在333.8kb单倍型中,与严重COVID-19风险相关的等位基因与Vindija 33.19尼安德特人基因组中的等位基因相似(图1b)。因此,危险单倍型与来自克罗地亚的尼安德特人的相应基因组区域相似,而与来自西伯利亚的尼安德特人的相似程度较小。

接下来,我们调查了尼安德特人和当今人是否可以从大约50万年前的这两个群体的共同祖先那里继承49.4kb的核心单倍型。 ,它不太可能起源于共同祖先,因为每一代的重组都倾向于将单倍型分解成较小的片段。假设世代时间为12年12,则本地重组率为13(每Mb 0.53 cM),尼安德特人与现代人类之间的分界为550,000年9,大约50,000年前两组之间的杂交,并使用已发布的等式14,我们排除了尼安德特人式单倍型源自共同祖先(P = 0.0009)。对于333.8kb长的尼安德特人式单倍型,来自共同祖先种群的起源的可能性甚至更低(P = 1.6×10 -26)。因此,危险单倍型从尼安德特人开始进入现代人口。这与先前的几项研究一致,这些研究已经确定了尼安德特人在该染色体区域15、16、17、18、19、20、21中的基因流(扩展数据表2)。风险单倍型与Vindija 33.19尼安德特人的紧密关系与这个尼安德特人相兼容,比其他两个尼安德特人10更接近为当今人贡献DNA的大多数尼安德特人。

预期在当前人群的基因组中发现的尼安德特人单倍型与尼安德特人的基因组比在当前人群中的其他单倍型更相似。为了研究49.4-kb单倍型与尼安德特人和其他人类单倍型的关系,我们分析了1000个基因组计划22中该基因组区域的所有5008个单倍型。我们纳入了尼安德特人基因组中所有被叫的位置,并排除了仅在一个染色体上发现的变体和在1000个基因组计划数据中仅见过一次的单倍型。这导致253种当今的单倍型包含450个可变位置。图2显示了与10次以上发现的单倍型相关的系统发育史(所有单倍型均参见图4的扩展数据)。我们发现与严重COVID-19相关的所有危险单倍型与三个高覆盖尼安德特人基因组形成了进化枝。在这个分支中,它们与Vindija 33.19尼安德特人最密切相关。

彩色区域突出显示了在rs35044562带有风险等位基因的单倍型,即严重COVID-19的风险单倍型。阿拉伯数字表示引导程序支持(100个重复项)。系统发育植根于当今人类的祖先序列。尼安德特人的三个基因组在该区域没有携带杂合子。比例尺,每个核苷酸位置的取代数。

在1000个基因组计划的个体中,非洲几乎完全没有尼安德特人衍生的单倍型,这与从尼安德特人到非洲人口的基因流是有限的并且可能是间接20的想法一致。尼安德特人的核心单倍型发生在南亚等位基因频率为30%,在欧洲,等位基因频率为8%,在等位基因频率为4%且在东亚地区等位基因频率较低的混合美国人中23(图3)。就载频而言,我们发现南亚50%的人至少携带一份风险单倍型,而欧洲的16%的人和9%的美国混血人携带至少一份风险单倍型。最高的载频出现在孟加拉国,那里一半以上的人口(63%)携带至少一份尼安德特人危险单倍型,而13%的单倍型是纯合的。因此,穴居人的单倍型可能是某些人群中COVID-19风险的重要因素,此外还包括其他因素,包括高龄。显然与此相符的是,来自孟加拉国的英国人死于COVID-19的风险比一般人群高24倍(危险比为2.0,95%的置信区间为1.7-2.4)。

饼图显示rs35044562处的次要等位基因频率。频率数据来自1000个基因组计划22。地图源数据来自OpenStreetMap 23。

值得注意的是,尼安德特人的危险单倍型在南亚的发生频率为30%,而在东亚则几乎不存在(图3)。南亚和东亚之间等位基因频率的这种差异程度是不寻常的(P = 0.006,图5的扩展数据),并表明它过去可能已经受到选择的影响。确实,先前的研究表明,孟加拉国25积极选择了尼安德特人的单体型。在这一点上,我们只能推测其原因-一种可能是针对其他病原体的保护。由于负选择,东亚的单倍型频率也可能降低,这可能是由于冠状病毒或其他病原体造成的。无论如何,第3号染色体上的COVID-19风险单倍型与其他尼安德特人和Denisovan遗传变异相似,由于正选择或漂移14、26、27、28而在某些人群中达到了高频率,但现在处于否定选择是由于COVID-19大流行。

目前尚不清楚尼安德特人来源地区的哪些特征赋予严重COVID-19的风险,以及任何此类特征的作用是否对SARS-CoV-2,其他冠状病毒或其他病原体具有特异性。一旦阐明了功能特征,就有可能推测尼安德特人对相关病原体的敏感性。但是,就当前的大流行而言,显然来自尼安德特人的基因流具有悲剧性后果。

使用LDlink 4.1 29计算连锁不平衡,并使用tabix 30(HTSlib 1.10)将等位基因与古基因组8、9、10、11进行比较。如所述,从1000个基因组计划22的第3阶段发布构建单体型。使用长谷川-岸野-野野-85-32替换模型,使用phyML 3.3 31估计系统发育,该模型具有伽玛形状参数,并根据数据估算出不变位点的比例。如先前所述,计算了由于谱系分选不完全而观察到特定长度或更长单倍型的可能性。如前所述。14根据当今人类的可变位置推算出的祖先状态来自Ensembl 33。使用已发布的渐渗图20过滤诊断性尼安德特人变种(在三个高覆盖率尼安德特人基因组中的固定位置和108名约鲁巴人的尼安德特人等位基因缺失),然后使用PLINK1.90 34(r在100个变体的滑动窗口中2的截止值为0.5)和1000基因组计划中的等位基因频率评估。使用Mathematica 11.0(Wolfram Research)和OpenStreetMap数据制作了显示不同人群中等位基因频率和连锁不平衡的图谱。

对于COVID-19 Host Genetics Initiative 2进行的荟萃分析,参与者均表示同意并获得了伦理学批准(https://www.covid19hg.org/partners/)。以下八项研究为住院与人群控制的荟萃分析做出了贡献:COVID-19相关疾病'BelCovid'的遗传修饰物(比利时布鲁塞尔自由大学),巴西人群'BRACOVID'中COVID-19并发症的遗传决定因素'(巴西圣保罗大学),deCODE(冰岛deCODE遗传学),FinnGen(芬兰芬兰分子医学研究所),GEN-COVID(意大利锡耶纳大学),Genes&Health(伦敦女王玛丽大学,英国),COVID-19-Host(年龄)(基尔大学以及奥斯陆和石勒苏益格-荷尔斯泰因州的大学医院,德国和挪威)和英国生物库(英国)。

有关研究设计的更多信息,请参见与本文链接的《自然研究报告摘要》。

支持该研究发现的全基因组关联研究的简要统计信息可从COVID-19宿主遗传学计划获得(第3轮,ANA_B2_V2:住院COVID-19的患者与人群对照的比较; https://www.covid-19.com)。 covid19hg.org/)。所使用的基因组可从1000基因组计划(第3阶段发布,https://www.internationalgenome.org/)和马克斯·普朗克进化人类学研究所(Chagyrskaya,Altai和Vindija 33.19,http://cdna.eva)获得。 mpg.de/neandertal/)。祖先等位基因可在Ensembl(版本100,https://www.ensembl.org/)上获得。地图数据来自OpenStreetMap,可从https://www.openstreetmap.org获得。

1. Ellinghaus,D。等。严重COVID-19与呼吸衰竭的全基因组关联研究。 N. Engl。 J. Med。 https://doi.org/10.1056/NEJMoa2020283(2020)。

2. COVID-19宿主遗传学倡议。 COVID-19宿主遗传学计划是一项全球计划,旨在阐明宿主遗传因素在SARS-CoV-2病毒大流行的敏感性和严重性中的作用。欧元。 J.哼基因28,715–718(2020)。

3.世卫组织。冠状病毒病(COVID-19)每周流行病学更新和每周运营更新:2020年9月14日每周流行病学更新https://www.who.int/emergencies/diseases/novel-coronavirus-2019/situation-reports(2020)。

5. Zhou,F。等。中国武汉市成年COVID-19住院患者死亡率的临床历程和危险因素:一项回顾性队列研究。柳叶刀395,1054–1062(2020)。

6.Green,R.E。等人。尼安德特人基因组的草图序列。科学328,710–722(2010)。

7. S. Sankararaman,N. Patterson,Li,H.,Pääbo,S.&Reich,D.尼安德特人与现代人类之间的杂交日期。 PLoS基因。 8,e1002947(2012)。

8.Prüfer,K。等。来自克罗地亚Vindija Cave的高覆盖尼安德特人基因组。科学358,655–658(2017)。

9.Prüfer,K。等。来自阿尔泰山的尼安德特人的完整基因组序列。自然505,43-49(2014)。

10.Mafessoni,F。等。 Chagyrskaya Cave的高覆盖尼安德特人基因组。进程Natl Acad。科学美国117,15132–15136(2020)。

11.Meyer,M。等。来自古老的Denisovan个人的高覆盖基因组序列。科学338,222–226(2012)。

12. Langergraber,K.E。等人。野生黑猩猩和大猩猩的世代时间表明,在大猩猩和人类进化过程中,发散时间更早。进程Natl Acad。科学美国109,15716–15721(2012)。

13.Kong,A。等。人类基因组的高分辨率重组图。纳特基因31,241–247(2002)。

14.Huerta-Sánchez,E.等。 Denisovan-like DNA渗入引起的藏族海拔适应。自然512,194–197(2014)。

15.Sankararaman,S。等。尼安德特人祖先在当今人类中的基因组景观。自然507,354–357(2014)。

16. Vernot,B.&Akey,J. M.从现代人类基因组中复活尚存的尼安德特人血统。科学343,1017–1021(2014)。

17.Vernot,B。等。从美拉尼西亚人的基因组中挖掘尼安德特人和丹尼索瓦人的DNA。科学352,235–239​​(2016)。

18.Steinrücken,M.,Spence,J. P.,Kamm,J. A.,Wieczorek,E.和Song,Y. S.基于模型的现代人类渗入尼安德特人血统的检测和分析。大声笑Ecol。 27,3873–3888(2018)。

19.Gittelman,R.M。等。古老的人参蛋白混合物有助于适应非洲以外的环境。 Curr。生物学26,3375–3382(2016)。

20. Chen,L.,Wolf,A.B.,Fu,W.,Li,L。和Akey,J.M。识别和解释非洲人明显的尼安德特人血统。细胞180,677–687(2020)。

21.Skov,L。等。 27,566个冰岛基因组揭示了尼安德特人渗入的性质。自然582,78-83(2020)。

22. 1000个基因组计划联盟。人类遗传变异的全球参考。自然526,68-74(2015)。

25. Browning,S. R.,Browning,B. L.,Zhou,Y.,Tucci,S.和Akey,J. M.对人类序列数据的分析揭示了两个古老的Denisovan外加剂脉冲。细胞173,53-61(2018)。

26. Dannemann,M.,Andrés,A. M.&Kelso,J.尼安德特人和Denisovan样单元型的渗入有助于人类Toll样受体的适应性变异。上午。 J.哼基因98,22–33(2016)。

27.Zeberg,H.,Kelso,J。&Pääbo,S。“尼安德特人”孕酮受体。大声笑生物学进化37,2655-2660(2020)。

28.Zeberg,H。等。穴居人的钠通道增加了现代人的疼痛敏感性。 Curr。生物学30,3465–3469(2020)。

29. Machiela,M. J.和Chanock,S. J. LDlink:一个基于Web的应用程序,用于研究特定人群的单倍型结构并链接可能的功能变异的相关等位基因。生物信息学31,3555-3557(2015)。

30. Li,H. Tabix:从通用TAB分隔文件中快速检索序列特征。生物信息学27,718–719(2011)。

31.Guindon,S。等。估计最大似然系统发育的新算法和方法:评估PhyML 3.0的性能。 Syst。生物学59,307–321(2010)。

32. M.长谷川,H。Kishino和T. Yano。通过线粒体DNA分子时钟分裂人类猿的年代。 J.摩尔进化22,160–174(1985)。

33.Yates,A.D。等。 Ensembl2020。核酸研究。 48,D682–D688(2020)。

34. Chang,C. C.等。第二代PLINK:应对更大,更丰富的数据集的挑战。 Gigascience 4,7(2015)。

我们感谢COVID-19主机遗传学计划提供了全基因组关联研究的数据,并感谢马克斯·普朗克学会和NOMIS基金会的资助。

汇总效果的比值比和P值分别为:比值= 1.60(95%置信区间为1.42-1.79)和P = 3.1×10 -15(双面z检验,n = 3199例COVID-19患者以及897,488个对照,涉及8项独立研究)。数据为比值比和95%置信区间。主机,年龄,英国欧洲生物银行(EUR),GENCOVID,deCODE和BelCovid使用欧洲人口控制。 BRACOVID,Genes&Health和FinnGen分别使用美国,南亚和芬兰的人口控制。

遗传变异之间连锁不平衡的热图,其中一个等位基因与三个尼安德特人的基因组共享并且在108个约鲁巴人中缺失。黑框突出显示rs17763537和rs13068572之间的333.8kb单倍型(3号染色体:45,843,315–46,177,096)。红色,r 2相关;蓝色,D'相关。

红色阴影表示1000基因组计划中的人群连锁不平衡的程度(r 2)。标记为“ n / a”的种群对于rs35044562的保护性等位基因是单态的。先前描述的指数变异(rs11385942)1在非洲人群的连锁不平衡中(r 2> 0.8)没有任何遗传变异。映射来自OpenStreetMap 23的源数据。

阴影区域突出显示了一个单基因组,其中包含rs35044562带有风险等位基因的所有当前单倍型和三个高

......