健康研究基于信任。阅读临床试验结果的卫生专业人员和期刊编辑假定试验已经发生并且结果是如实报道的。但是大约 20% 的时间,Monash Health 的妇产科教授 Ben Mol 说,他们是错误的。由于我 40 年来一直关注研究造假问题,因此我并不像很多人对这个数字感到惊讶,但它让我认为现在是时候停止假设研究确实发生并且诚实地报道了,并假设研究是欺诈性的,直到有一些证据支持它已经发生并被诚实报告。提供“可信信息”的 Cochrane Collaboration 现在已经朝这个方向迈出了一步。正如他在上周的网络研讨会上所描述的那样,伦敦卫生与热带医学学院流行病学教授伊恩·罗伯茨(Ian Roberts)在一位同事问他是否知道他的系统评价显示甘露醇减半后开始怀疑试验的诚实报告头部受伤导致的死亡是基于从未发生过的试验。他没有,但他开始调查这些试验并确认它们从未发生过。他们都有一个主要作者,他声称来自一个并不存在的机构,几年后他自杀了。这些试验均发表在著名的神经外科杂志上,并有多名合著者。没有一位共同作者为试验贡献了患者,有些人直到试验发表后才知道他们是共同作者。当罗伯茨联系其中一本期刊时,编辑回应说“我不相信这些数据。”罗伯茨想知道,他为什么要发表试验?没有一项试验被撤回。后来,作为 Cochrane 小组的负责人之一,Roberts 对胶体与晶体进行了系统评价,结果再次发现该评价中包含的许多试验是不可信的。他现在对所有系统评价都持怀疑态度,尤其是那些主要是对多项小型试验的评价。他将系统评价的最初想法与寻找钻石进行了比较,如果将系统评价汇集在一起就可以获得知识;现在他认为系统审查就是在垃圾中寻找。他建议应该放弃小型单中心试验,而不是在系统评价中合并。与罗伯茨一样,摩尔进行了系统审查,结果却发现大多数试验要么是存在致命缺陷的僵尸试验,要么是不可信的。他问道,问题的规模是什么?虽然撤稿在增加,但只有大约 0.04% 的生物医学研究被撤稿,表明问题很小。但麻醉师约翰卡莱尔分析了提交给 Anesthesia 的 526 项试验,发现其中 73 项(14%)有错误数据,43 项(8%)被他归类为僵尸。当他能够检查 153 项研究中的个体患者数据时,67 项 (44%) 的数据不可信,40 项 (26%) 是僵尸试验。许多试验来自相同的国家(埃及、中国、印度、伊朗、日本、韩国和土耳其),当斯坦福大学教授 John Ioannidis 检查从这些国家提交给 Anesthesia 的试验的个体患者数据时在一年中,他发现很多都是假的:在埃及是 100% (7/7); 75% (3/ 4) 在伊朗; 54% (7/13) 在印度; 46% (22/48) 在中国; 40% (2/5) 在土耳其; 25% (5/20) 在韩国; 18% (2/11) 在日本。大多数试验都是僵尸。 Ioannidis 得出的结论是,仅这些国家就发表了数十万个僵尸试验。其他人也发现了类似的结果,而 Mol 的最佳猜测是大约 20% 的试验是错误的。这些论文很少被撤回。我们早就知道同行评审在检测欺诈方面是无效的,特别是如果评审员开始假设研究是诚实报告的,就像大多数人直到现在一样。我记得在 1990 年代参与调查英国最骇人听闻的欺诈案件之一,当时该研究的统计审查员告诉我们,他发现该研究存在多个问题,只希望它做得比报道的好.我们询问是否曾考虑过该研究可能是欺诈性的,他告诉我们他没有。我们现在已经到了一个地步,那些进行系统评价的人必须首先假设一项研究是欺诈性的,直到他们能得到一些相反的证据。一些支持证据来自已注册并获得伦理委员会批准的试验。奥克兰大学医学副教授 Andrew Grey 和其他人制定了一份清单,其中包含大约 40 个项目,可用作欺诈筛查工具(您可以在此处查看清单)。重新评估的清单(研究治理、伦理、作者、剽窃、研究行为、分析和方法、图像处理、统计、错误、数据处理和报告)涵盖了诸如“道德监督和资金、研究生产力和研究人员工作量、随机化的有效性”等问题,结果的合理性和重复的数据报告。”该清单已用于检测随后被撤回但尚未通过您对临床筛查工具所期望的全面评估的研究。 (但我必须祝贺作者们使用了一个聪明的首字母缩略词:有人说为一项研究设计首字母缩略词是整个过程中最困难的部分。)
罗伯茨和其他人六年前在 BMJ 上写了许多不可信和僵尸试验的问题,标题很挑衅:“支撑医疗保健的知识体系不适合目的,必须改变。”他们希望 Cochrane Collaboration 和任何进行系统评价的人都非常重视欺诈问题。这可能是巧合,但在网络研讨会前几周,Cochrane 协作组织制定了有关审查研究的指南,其中有撤回、表达担忧或审查员担心数据的可信度。撤稿是最容易处理的,但正如 Mol 所说,它们只是不可信或僵尸研究的一小部分。 Cochrane 图书馆随新指南发表的一篇社论承认,对于不可信研究的构成没有一致意见,筛选工具不可靠,并且“错误分类还可能导致作者名誉受损、法律后果和与参与者相关的道德问题参与了研究,只为打折。” The Collaboration 是谨慎的,但确实会失去信誉和收入——如果世界不再信任 Cochrane Reviews,因为它们被认为是基于不可信的试验。研究造假通常被视为“坏苹果”问题,但在网络研讨会上发言的芭芭拉·K·雷德曼 (Barbara K Redman) 坚持认为,如果不是腐烂的森林或果园,这不是坏苹果的问题,而是坏桶的问题。在她的《生物医学研究不端行为政策:超越坏苹果方法》一书中,她认为研究不端行为是一个系统问题——系统提供了发布欺诈性研究的激励措施,但没有足够的监管程序。研究人员通过发表研究取得进步,而且由于出版系统建立在信任基础上,同行评审并非旨在检测欺诈,因此很容易发表欺诈性研究。期刊和出版商的商业模式取决于出版,最好是尽可能便宜地进行大量研究。他们几乎没有动力去检查欺诈行为,也不会因为撤回研究而遭受声誉损害——可能还有法律风险。资助者、大学和其他研究机构同样有动力资助和发表研究,也有动力反对他们可能在他们的机构资助或进行的欺诈性研究——也许是他们的明星研究人员之一。监管机构通常缺乏应对明显广泛的欺诈行为的法律地位和资源,因为他们认识到证明一项研究是欺诈性的(而不是怀疑它是欺诈性的)是一个熟练、复杂且耗时的过程。另一个问题是,研究越来越国际化,来自许多国家的许多机构的参与者:那么谁来承担调查欺诈的艰巨任务?科学确实需要全球治理。罗伯茨总结道,除了那些因欺诈数据接受治疗的患者之外,每个人都从出版游戏中获益。我的前任 The BMJ 编辑 Stephen Lock 在 1980 年代开始担心研究造假,但人们认为他的担忧很古怪。研究机构坚持认为欺诈很少见,这无关紧要,因为科学是自我纠正的,而且没有患者因科学欺诈而遭受痛苦。所有这些不重视研究造假的理由都被证明是错误的,从洛克的担忧开始 40 年,我们意识到问题很大,系统鼓励造假,我们没有足够的方法来应对。也许是时候从假设研究是诚实地进行和报告转变为假设它不值得信赖,直到有一些相反的证据。竞争利益:RS 是医学伦理委员会 (COPE) 的联合创始人,多年来担任 Cochrane 图书馆监督委员会主席,以及英国研究诚信办公室董事会成员。