那些突然被删除的病毒序列?他们回来了

2021-08-01 03:45:49

一批丢失了一年的早期冠状病毒数据已经从隐藏中出现。 6 月,一位美国科学家发现,在大流行初期在中国分离的 Covid-19 患者样本中,有 200 多个基因序列令人费解地从在线数据库中删除。通过一些数字侦查,西雅图 Fred Hutchinson 癌症中心的病毒学家 Jesse Bloom 设法在 Google Cloud 上追踪了 13 个序列。当布鲁姆博士在网上发布的一份报告中分享他的经历时,他写道,“这些序列似乎被删除以掩盖它们的存在。”但现在出现了一个奇怪的解释,源于科学期刊的编辑疏忽。这些序列已上传到另一个由中国政府监管的数据库中。故事开始于 2020 年初,当时武汉大学的研究人员研究了一种检测席卷全国的致命冠状病毒的新方法。他们从武汉一家医院的 34 名患者的病毒样本中对一小段遗传物质进行了测序。研究人员于 2020 年 3 月在网上发布了他们的发现。当月,他们还将序列上传到由美国国立卫生研究院维护的名为 Sequence Read Archive 的在线数据库,并向名为小的。该论文发表于 2020 年 6 月。布鲁姆博士在研究 Covid-19 的起源时发现了今年春天的武汉序列。在阅读 2020 年 5 月关于冠状病毒早期基因序列的评论时,他发现了一个电子表格,上面注明了它们在 Sequence Read Archive 中的存在。

但是 Bloom 博士在数据库中找不到它们。他于 6 月 6 日通过电子邮件向中国科学家发送电子邮件,询问数据的去向,但没有得到回复。 6 月 22 日,他发布了他的报告,被《纽约时报》和其他媒体报道。当时,美国国立卫生研究院的一位女发言人表示,该研究的作者已于 2020 年 6 月要求从数据库中撤回这些序列。作者通知该机构,序列正在更新,并将添加到不同的数据库中。 (作者没有回应《泰晤士报》的询问。) 7 月 5 日,在研究人员从 Sequence Read Archive 中撤回这些序列一年多后,在 Bloom 博士的报告在线发表两周后,这些序列被悄悄上传到了由中国国家生物信息中心维护的数据库,由武汉大学研究员、Small 论文的合著者胡本维护。 7 月 21 日,在北京举行的新闻发布会上提到了这些序列的消失,中国官员在会上否认了大流行始于实验室泄漏的说法。根据官方媒体新华社记者对新闻发布会的翻译,中国国家卫生健康委员会副部长曾义新博士表示,Small 的编辑删除了其中科学家们的一段话,由此引发了麻烦。描述了序列读取存档中的序列。 “因此,研究人员认为不再需要将数据存储在 NCBI 数据库中,”曾博士说,他指的是 Sequence Read Archive,它由 NIH 运营,Small 的编辑,专门研究 NCBI 的科学。微米和纳米级,总部设在德国,证实了他的帐户。 “数据可用性声明被错误地删除了,”编辑 Plamena Dogandzhiyski 在一封电子邮件中写道。 “我们将很快发布更正,以澄清错误并包含指向现在托管数据的存储库的链接。”

目前尚不清楚为什么作者在要求将序列从 Sequence Read Archive 中删除时没有提及期刊的错误,或者为什么他们告诉 NIH 序列正在更新。也不清楚为什么他们等了一年才将它们上传到另一个数据库。胡博士没有回复要求置评的电子邮件。 Bloom 博士也无法解释相互矛盾的说法。 “我不能在他们中间做出裁决,”他在接受采访时说。就其本身而言,这些序列无法解决有关大流行如何起源的开放性问题,无论是通过与野生动物的接触、实验室泄漏还是其他途径。武汉研究人员在最初的报告中写道,他们从“流行初期疑似 Covid-19 的门诊患者的样本中提取了遗传物质。”但是,中国数据库中的条目现在表明,它们是在 1 月 30 日从武汉大学人民医院取出的——距中国最早报道 Covid-19 将近两个月。虽然序列的消失似乎是编辑错误的结果,但布鲁姆博士认为寻找可能潜伏在网上的其他冠状病毒序列仍然值得。 “这绝对意味着我们应该继续寻找,”他说。