为什么这么多科学都是错的

2020-09-25 22:07:20

在科学家们似乎把一切都搞错的这一年里,一本试图解释原因的书却出奇地相关。当然,早在大流行开始之前,科学就陷入了深深的困境,斯图尔特·里奇(Stuart Ritchie)的优秀科幻小说:欺诈、偏见、疏忽和炒作如何破坏了对真相的探索,已经酝酿了很长时间。尽管如此,非常受欢迎,而且非常重要。

对于像我这样的逆向投资者来说,阅读“里奇”对我的精神健全有好处,但对我的思想正直有坏处。很多人,甚至是专家,都会自欺欺人地认为自己知道实际上不知道的事情,这让我的先见之明火上浇油。无论是登上新闻头条的那种奇妙的科学结果,还是那些逐渐引起公众关注的奇妙科学结果,往往制作得如此糟糕,以至于结果站不住脚;它们没有捕捉到世界上任何真实的东西。这本书为科学机构敲响了警钟,这些机构往往被自己博学的宣言蒙蔽了双眼。

充满了例子和通俗易懂的解释,里奇熟练地带领读者踏上了一段穿越科学的许多麻烦的旅程。他根据书中的四个副标题对它们进行了分类:欺诈、偏见、疏忽和炒作。合在一起,它们都破坏了对真理的追求,而这正是科学存在的理由。这并不是说科学家故意撒谎、欺骗或欺骗--尽管这种情况经常发生,即使是在最好的期刊上也是如此-而是设计糟糕的实验、动力不足的研究、电子表格错误或有意或无意地操纵p值所产生的结果太好了,以至于令人难以置信。由于学者的职业生涯依赖于出版新奇、引人入胜和有意义的成果,所以他们中的大多数人都不是吹毛求疵的人。如果统计软件说“意义重大”,他们就会自信地写下这项研究,并在一家排名第一的期刊、其编辑和本应监督他们错误的该领域松懈的同行面前,有说服力地论证他们令人惊叹的案例。

里奇不是在他妈妈的地下室里工作的某个疯狂的科学否定论者或阴谋论者;他是伦敦国王学院(King‘s College London)的一位著名心理学家,在揭穿拙劣的研究方面经验丰富,特别是在他自己的心理学领域。在过去的十多年里,这门学科一直是“复制危机”的不幸典范,用斯坦福大学的约翰·约阿尼迪斯(John Ioannidis)的著名文章标题来说,这一发现--“大多数发表的研究结果都是错误的”。

以前康奈尔大学心理学教授达里尔·贝姆(Daryl Bem)和他臭名昭著的“通灵色情”实验为例,该实验打开了里奇的书。在屏幕上,1000名本科生被展示了两幅窗帘,其中只有一幅隐藏了学生们应该找到的图像。这个选择是掷硬币决定的,因为他们没有其他信息可查。正如预期的那样,对于大多数类型的图像,他们大约有50%的时间选择了正确的窗帘。但是--这就是本的成名理由--当色情图片隐藏在卷边后面时,学生们有53%的时间会选择正确的图片,足以在他的样本中被认为具有统计学意义。通往一流出版物的道路是敞开的。

当这篇文章在通过同行评议后发表时,全世界都震惊地得知,本科生可以看到未来-至少在涉及到性本质的图片时是这样。经科学证明,经科学方法™认证,心理学界陷入混乱。这项研究做得很好,通过了同行评议,并发表在一本顶级的领域期刊上,方法与该领域所有其他知名结果的基础相同。尽管如此,结果还是完全是疯狂的。哪里出了问题?

或者以行为经济学的老头子丹尼尔·卡纳曼(Daniel Kahneman)为例,他的许多古怪实验让整个经济学专业相信了个人的非理性,并最终为他赢得了诺贝尔奖。行为经济学家使用的关于所谓“启动”的心理学文献表明,环境的微小变化可能会对行为产生非常大的影响。例如,通过符号或硬币的滴答声微妙地提醒人们金钱,会让他们的行为更个人化,对他人的关爱更少。卡纳曼在他著名的畅销书“快与慢”中写道:“怀疑不是一种选择,你别无选择,只能接受这些(启蒙)研究的主要结论是真实的。”

从2010年代开始,心理学家试图复制这些著名的结果,甚至更多。当在其他地方尝试时,对于其他学生、更好的设备或更大的样本-或者有时使用完全相同的数据-不会出现同样的结果。真奇怪。实验室团队试图复制许多已有的研究结果,但结果却差强人意:“复制危机似乎已经抹去了大约一半的心理学研究,”里奇写道,“打了个响指。”心理学发现的方式在结构上有问题

偶遇,就像本姆的超自然学生一样,有时会出现在出版的文学作品中。更令人沮丧的是真实的欺诈事件,科学家们伪造数据、篡改数据,或者干脆凭空捏造数据。里奇的许多故事可能会让你对许多科学机构失去信心:科学家发明电子表格(之所以被发现,只是因为人类非常不善于创造真正的随机性),横向倾斜显微镜图像,重复使用相同的数字,同时假装它们是另一个数据集。

虽然每个人都同意欺诈是一个问题,挑战是在它造成太大破坏之前防止它或发现它,但其他缺陷(偏见、疏忽和炒作)更普遍,也更具破坏性。他们以更微妙的方式运作,看不见,外人不可能适应。就拿文件抽屉的问题来说,负面的结果被塞了起来,而积极的结果-最常见的是偶然获得的结果,比如本姆的通灵实验-被送去出版,给人一种对世界状况的错误印象,无论是在文学上还是对更广泛的公众来说都是如此。

里奇的书中引人入胜的是对许多研究、主张和实验的讨论,即使是非专家也熟悉这些内容。里奇被广泛引用和引用,他报告了以下被炒作的故事存在的巨大问题:

摆强有力的姿势(男性张开或将双手积极地放在臀部)会产生一种心理和荷尔蒙的提升,这与更高的风险容忍度和更好的生活结果相关。

菲利普·津巴多(Philip Zimbardo)的斯坦福监狱实验和当权者的不人道残忍(也许最有效的揭穿是吉娜·佩里(Gina Perry)关于著名心理学实验的许多深入著作)。

正如马修·沃克的畅销书“为什么我们睡觉”所说的那样,每晚睡眠不足6小时“会破坏你的免疫系统,使你患癌症的风险增加一倍”。

都错了。这些广为宣传和讨论的说法中,每一个都至少包括以下一项:研究本身没有保证的误导性结论;捏造的数据;为了通过显著性测试而对数据进行粗暴处理;不合格的实验设计;或者当其他科学家尝试时无法复制的实验。向非专业观众剖析它们才是里奇真正闪耀的地方。

我们对新闻标题误解、夸大或没有报道细微差别并不感到惊讶,但里奇表明,即使是支持这些说法的出版文献也存在有害的缺陷,破坏了它们的结果。对于世界其他地区而言,这并不重要。对于这些说法,猫已经泄露了秘密。他们的许多成果已经到达非科学领域的公众手中,并成为“常识”。我个人有三个不同的人,在不同的场合,告诉我吃鸡蛋的危险-其中两个人在世界上一些最负盛名的大学攻读博士学位。敏锐和正确是两码事。

这让我认为,炒作是科学众多罪过中最严重的,因为热衷于触发的研究人员(甚至像NASA这样备受尊敬的机构)就一些革命性的声明撰写了夸张的新闻稿,事实证明这些声明是欺诈性的、疏忽的、制作的劣质的、动力不足的,或者只是完全没有得到自己的研究的支持。

其中一些令人毛骨悚然的错误研究故事在现实世界中产生了严重的后果:例子包括莱因哈特和罗格夫的政府债务抑制增长错误,保罗·马基亚里尼(Paolo Macchiarini)在卡罗林斯卡研究所(Karolinska Institute)为患者进行的欺诈性手术,或者完全捏造的研究,表明麻疹、腮腺炎和风疹疫苗联合接种会导致自闭症。即使是更小、更无害的错误,如p-hack、改变结果标杆,或者影响太大的动力不足的研究,都会伤害科学,让世界变得更糟,因为医生和政策制定者在决策中使用这些错误。

在偏见一章中,里奇自己一度失去了希望,他在思考如何克服所有这些统计和人为的失败,以产生关于世界的准确知识:“我的反应是我不知道,”他写道。

不知何故,他仍然以稍微积极的语气结束。最后两章为科学如何改善其众多挑战提供了许多充满希望的建议:我们可以以不同的方式资助研究;如果研究设计足够好,期刊可以预先承诺发表,发布更多负面结果;我们可以预先注册方法,这样研究人员就不能在研究中期改变目标变量;我们可以在发表之前扣留一些拨款,以对那些将不成功的结果归档的研究人员进行经济惩罚。

更令人耳目一新的是计算机技术及其带来的猖獗的透明度。整个数据集都可以放在网上,代码可以由更多的同行审查员和编辑逐行分析,而不是通常这样做的少数同行审查员和编辑。此外,我们之所以首先发现了这么多欺诈者,是因为我们使用了聪明的算法,发现了报告结果的统计输出中的不一致之处。

里奇警告说,不要“怀疑任何和所有的新结果,因为我们知道科学进步的潮流远不是纯粹的。”健康的怀疑是好的-把婴儿和任何受污染的洗澡水一起扔掉是不好的。他宣称,科学是“人类最自豪的成就之一”,仅仅因为其中很多是错误的、错误的、夸张的或误导性的,并不意味着它从未正确地识别出任何重要的东西。相反地。

虽然我看到自己落入了里奇担心的陷阱-人们会滥用他的书来否认甚至是公认的科学成果-但他更担心的是相反的问题。这是正确的:人们,特别是在西方,对科学家的信任度非常高-在一些国家达到了90%以上。例如,在英国,随着时间的推移,人们似乎越来越信任科学及其结果。

这本书虽然令人恐惧和沮丧,但它是一本追求真理的书,最终也是一本乐观的书。里奇不是来埋葬科学的,他是来修复它的。“科学过程的理想不是问题,”他在最后一页写道,“问题是我们在实践中进行研究的方式背叛了这些理想。”