科学家发现了神秘删除的早期病毒序列

2021-06-24 05:13:16

大约一年前,武汉Covid-19早期从200多种病毒样本的遗传序列从在线科学数据库中消失了。

现在,通过通过存储在Google Cloud上的文件来源,在西雅图报告中,他已经恢复了13个原始序列 - 有趣的新信息,用于辨别病毒可能已经从蝙蝠或其他动物溢出到人类中。

新分析周二发布,突破了早期的建议,即2019年12月与动物和海鲜市场相关的初期爆发之前,各种冠状病毒可能已经在武汉传播。

由于拜登行政管理调查了病毒的有争议的起源,称为SARS-COV-2,该研究既不加强,也不折扣假设,即病原体泄漏出着着名的武汉实验室。但它确实提出了关于删除原始序列的原因,并表明从互联网的远角恢复可能有更多的启示。

“这是一件肯定的一件令人兴奋的工作,它显着推进了解SARS-COV-2的起源,”亚利桑那大学的进化生物学家Michael Worobey说,这是一个不参与该研究的进化生物学家。

Jesse Bloom是弗雷德哈钦森癌症研究中心的病毒学家,他们写了新报告,称为删除这些序列可疑。它“似乎似乎删除了序列以模糊他们的存在,”他在本文中写道,尚未在科学期刊上进行同行审查或发表。

绽放博士和Worobey博士属于一群直言不讳的科学家们,他们呼吁更多研究流行如何开始。在5月份发布的一封信中,他们抱怨说,没有足够的信息来确定是否更有可能是实验室泄漏蔓延到冠状病毒,或者它从与实验室外面的受感染的动物接触的人类困扰。

病毒样品的遗传序列占据了SARS-COV-2如何从另一只动物移位的SARS-COV-2如何,最可能是一个蝙蝠。所有的珍贵都是大流行早期的序列,因为他们认为科学家更接近原来的溢出事件。

由于盛开博士正在审查各种研究小组发表的遗传数据,他遇到了2020年3月2020年3月的一项电子表格,其中包括武汉大学科学家收集的241个遗传序列的信息。电子表格表明,科学家们将序列上传到一个名为序列读取存档的在线数据库,由美国政府的国家医学图书馆管理。

但是,当博士本月早些时候在数据库中寻找武汉序列时,他唯一的结果是“没有找到物品”。

困惑的是,他回到了电子表格以获得任何进一步的线索。它表明,241次序列由武汉人民医院的一位名叫AISI FU的科学家收集。搜索医学文献,Bloom博士最终发现了另一项研究于2020年3月由Fu及其同事博士在线发布,描述了SARS-COV-2的新实验测试。中国科学家三个月后在科学期刊上发表了它。

在那项研究中,科学家们写道,他们从鼻拭子中拍摄了45个样本,“从疫情的疑似Covid-19的门诊患者从外部患者中获取。”然后,他们在拭子中搜索了SARS-COV-2的一部分遗传物质。研究人员没有发布他们捕捞超出样品的基因的实际序列。相反,它们仅在病毒中发表了一些突变。

但是许多线索向博士绽放,样本是241缺失序列的来源。这些论文没有解释为什么序列已上传到序列读取存档,稍后只会消失。

填写档案,Bloom博士认为许多序列被存储在Google Cloud上的文件。他报告说,每个序列都包含在云中的文件中,以及文件的名称都共享相同的基本格式。

Bloom博士在代码中交换了武汉的遗漏序列。突然,他有序列。总而言之,他设法以这种方式从云中恢复13个序列。

通过这种新数据,彭博士在大流行的早期阶段再次回头。他将13个序列与其他出版的早期冠状病毒序列相结合,希望在建造SARS-COV-2的家谱上进行进展。

摘出SARS-COV-2从蝙蝠病毒演变的所有步骤都是一个挑战,因为科学家仍有有限数量的研究。最早的一些样品来自武汉的环南海鲜批发市场,在这里发生疫情2019年12月发生。

但这些市场病毒实际上有三个周末收集的SARS-COV-2样品中缺少了三种额外的突变。换句话说,那些后来的病毒看起来更像蝙蝠中发现的冠状病毒,支持这个想法,即没有通过海鲜市场的病毒早期血统。

Bloom博士发现,他从云中恢复的删除序列也缺乏这些额外的突变。 “他们三个步骤比蝙蝠冠状病毒更像来自环南鱼市场的病毒,”布隆博士说。

他说,这表明,当时SARS-COV-2到达市场时,它一直在武汉或超越的一段时间。他争辩,市场病毒并不代表2019年底已经松散的冠状病毒全部多样性。

“也许我们在武汉早期出现的照片可能会有所偏见,”他说。

在他的报告中,Bloom博士承认这一结论必须通过对病毒序列的深入分析来确认。 Worobey博士说,他和他的同事正在研究SARS-COV-2基因的大规模研究,以更好地了解其起源,现在他们现在将添加Bloom的13次恢复的序列。

“这些额外的数据将在这种努力中发挥重要作用,”Worobey博士说。

目前尚不清楚为什么这个有价值的信息首先缺少。科学家可以要求通过向序列读取存档的管理者发送电子邮件来删除文件。管理档案馆的国家医学图书馆表示,去年夏天删除了13个序列。

“这些SARS-COV-2序列于2020年3月在SRA发布,随后提交调查员于2020年6月被提交的调查员撤回,”国家健康研究院的发言人叛扬的Myles表示。

她说,她没有名字的调查员告诉档案管理者,序列正在更新,并将添加到不同的数据库中。但Bloom博士已经搜索了他知道的每个数据库,并且尚未找到它们。 “显然我无法排除序列在某个地方的其他数据库或网页上,但我没有能够找到我所看到的任何明显的地方,”他说。

2020年测试研究的三个共同作者产生了13个序列的测试,没有立即回复电子邮件询问绽放博士的发现。该研究没有为另一项共同作者提供联系信息,福禄博士,其他研究也命名了电子表格。

一些科学家们持怀疑态度,即在去除序列后面有任何险恶。 “我真的不明白这一点是如何掩饰的,”犹他大学的病毒学家Stephen Goldstein说。

Goldstein博士指出,测试纸上列出了武汉研究人员在其测试中发现的个体突变。他说,虽然完整的序列不再是存档中的不再是存档,但关键信息已公开一年多发。它只是以难以为研究人员找到的格式藏起来的。

“你不能真正说出他们被删除的原因,”布卢姆博士在面试中承认。 “你可以说删除它们的实际后果是人们没有注意到它们存在。”他还指出,中国政府命令破坏了一些病毒早期样本,并在未经批准的情况下禁止在冠状病毒上发表论文。

为了他的部分,沃尔比尤博士仍然想要答案。 “我希望我们能听到那些生成的作者,然后删​​除这些关键序列,所以我们可以了解更多关于他们这样做的动机,”他说。 “它当然是面部价值的奇怪,真正要求解释。”

无论这13个序列发生在发生的情况下,盛开的博士现在讨厌在线发现其他线索。为了重建Covid-19的起源,所有这些线索都可能重要。

“理想情况下,我们需要尝试找到尽可能多的其他早期序列,”他说。 “我认为这项研究表明我们应该看各地。”