开放科学与可再生性的区别

2020-09-15 12:21:41

由Susan T.Fiske编辑,普林斯顿大学,新泽西州普林斯顿,批准于2020年7月27日(2019年12月7日收到供审查)。

科学正在经历快速变化,改进科学的运动主要侧重于可再现性/可复制性和开放的科学实践。这一变革的时刻-在这一时刻,科学转向国内,审视其方法和实践-提供了一个机会,以解决其历史上缺乏多样性和不包容的文化。通过网络建模和语义分析,我们初步探索了开放科学文献的结构、文化框架和女性参与的情况(n=2926篇文章和会议记录)。网络分析表明,开放科学和可重复性文献相对独立地出现,共享的论文或作者很少。接下来,我们检查这些文献是否以不同的方式融合了协作的、亲社会的理想,这些理想被认为比独立的、赢家通吃的方法更能让代表不足的群体的成员参与进来。我们发现开放科学比可再生性更具关联性和协作性。对论文摘要的语义分析表明,这些文献采用了不同的文化框架:开放科学包含了比可再现性更明确的社区语言和亲社会语言。最后,与表明公共目的和亲社会目的的多样性益处的文献相一致,我们发现女性更频繁地在开放科学中的高地位作者位置(第一或最后)发表文章(与可再生性相比)。此外,这一发现还受到团队规模和时间的影响。在可再生性方面,女性在更大的团队中有更多的代表,随着时间的推移,女性参与开放科学的人数在增加,可再生性在下降。最后,我们提出了培养更亲社会、更多样化的科学文化的可行建议。

目前,科学正在经历一场自我完善的“革命”(1)。这场革命的目的是大胆的。改进科学的运动的核心包括两个主要目标:1)了解过去科学过程和发现的缺陷、弱点和重现性(例如,评估证据的强度)和2)通过更严格和更透明的方式改进研究实践(例如,公开共享数据、代码、资源;标准化的统计程序;预注册)。与任何革命一样,动乱时期也可能是机会时期。事实上,参与改进科学的研究人员已经认识到性别多样性问题(2,3),这次改革提供了以更具包容性的方式重塑科学文化的机会。如果改进科学的运动使重视独立、主导或敌对价值观的传统科学文化永久化,就有可能继续让许多有才华的人处于边缘地位,感到不受欢迎和被排斥(4)-加剧科学试图解决的全球问题(5⇓⇓-8)。在努力改进其方法和可复制性的过程中,我们想知道科学是否也在改进这场运动本身的性别代表性和包容性。本文运用文化和网络分析来考察改进科学运动中的新兴文化,特别是在可再生性和开放性的科学文献中,并调查女性在这些新兴亚文化中的代表性。我们讨论了这些不同的文化途径对科学发展的影响。

在文化分析中,个人的行为和认知既产生于群体和机构的规范和实践,也产生了群体和机构的规范和实践(9)。此外,文化实践的“谁”和“如何”是密不可分的:亚文化“如何运作”影响“谁”从事亚文化,“谁”从事亚文化影响亚文化“如何运作”。当前科学改革运动的文化实践影响着从事这项运动的人。新兴的改革运动植根于更广泛的科学、技术、工程和数学文化(STEM),这些文化可以成为包容和提高妇女地位的障碍(10⇓-12)。长期以来,科学文化一直重视个人的才华、竞争和赢家通吃的成功模式(13)。特别是,STEM内外的人认为STEM领域比亲社会和合作领域提供了更多的个人成功和成就的机会(14)。

奖励个人成就的科学实践可能在不知不觉中培养了一种更独立、更具竞争力的文化,这种文化忽视了合作,甚至可能会扼杀合作(15,16)。这些文化实践对谁在科学领域中的加入和进步产生了影响。例如,感觉到的韵律缺失

我们的团队对开放科学和可重复性文献进行了网络分析,发现这些文献几乎没有共同的论文和作者-这表明这些改进方法是相对独立地发展起来的。有鉴于此,我们比较了这些文献中协作文化和亲社会文化的特征。通过对文章摘要的语义文本分析,我们发现开放科学与可再生性文献之间存在着更为紧密的作者网络,开放科学文献和可再生性文献似乎采用了不同的显性文化框架。与再现性相比,开放科学包含了更多反映亲社会性文化价值的语言。然后,我们考察了这些文献中女性参与的结构。我们发现,妇女参与的模式符合这样的理论观点,即在更多的合作和亲社会文化中,妇女参与的限制较少(即,在开放科学中,而不是在可再生性方面)。与可再生性相比,女性学者更有可能在开放科学中占据高地位的作者职位(占据第一或最后作者的位置)(见图3);此外,在可再现性范围内,女性高地位作者身份较少出现在较小的团队中(与开放科学相比)。在规模较大的团队中--这可能会提供更大的集体安全或共同目标--这两篇文献在女性在领导角色中的代表性方面几乎没有什么不同。最后,我们发现,在开放科学中,女性在高地位作者职位上的参与率随着时间的推移而增加,而其再现性却在下降。

综上所述,我们发现,尽管目前存在争议(2),改进科学的运动的开放科学焦点已经孕育了一种相互关联的亲社会文化,如果进一步培养,可能会继续吸引更多的女性参与。我们相信,开放科学的协作、前瞻性关注有可能促进更大的多样性和包容性。虽然我们在这篇文章中对作者性别的关注在一定程度上是因为我们能够应用经过验证的、自动化的编码方法(高度重复性)来确定作者性别,但我们仍然会预测来自其他代表性不足群体的学者也会有类似的发现。当领域更具对抗性和更不亲社会时,来自代表性不足群体(包括女性)的个人可能不太有动力参与(40),这至少部分是由于上述权力动态。相反,强调协作和亲社会规范的领域激发了代表不足的群体更多的参与(41)。应该指出的是,敌对和合作文化都可以进行激烈的辩论和批评。然而,合作文化可能会提供更多建设性的批评,这是优秀的、具有前瞻性的科学的标志,也是所有科学家对该领域同行的期望。如果我们希望改进和推进科学领域,那么研究人员就有责任培养一种吸引和留住不同人群的文化(42⇓-44)。

我们同时进行了网络科学和语义文本分析,以确定开放科学和可再生性文献的结构景观和文化焦点,以及女性参与其中的情况。为此,我们的团队分析了来自微软学术图表(MAG)(45)的数据,这些数据由2010年至2017年发表的2926篇科学文章和会议论文集(以下称为“论文”)组成,其中包括“开放科学”或“再现性”作为研究领域的代码(方法和SI附录)。该样本由879篇开放式科学论文和2047篇重复性论文组成。只有2.3%的论文共享“开放科学”和“可再现性”字段代码,这表明这些方法是相对独立发展的(更多细节见SI附录)。

我们分析了开放科学文献中的3157个独特的文章作者标识号(ID)和可再现性文献中的8766个。我们使用MAG的这些作者ID建立了两个协作网络(图1)。这些网络中的节点代表科学论文;边代表共享的作者,因此如果两篇论文中至少出现一位作者,则两个节点共享一条边(有关详细信息,请参阅方法)。结果表明,开放科学网络包含879个节点和389条边,而可重复性网络包含2047个节点和856条边。重要的是,开放科学网络的边缘密度(0.101%)比可再现性网络(0.041%)更高,显示出更高的互联性,这表明开放科学文献中存在更密集的协作网络(单边费舍尔精确检验:P<;0.001)。

我们还对每个文献(47,48)进行了连通成分分析,以测量隔离程度

在开放科学中,女性更有可能出现在高地位的作者职位上(与可再生性相比)。

在开放科学文献中,女性学者更有可能出现在较高的作者位置(即,第一或最后作者位置),而在可再现性文献中,女性学者更有可能出现在较高地位的作者位置上。图3显示了单作者和多作者论文的开放科学文献和可再现性文献的性别表征。单著子集包括255篇开放式科学论文和342篇再现性论文,多作者子集包括624篇开放式科学论文和1705篇再现性论文。由于不同的领域惯例,如果一名学者在一篇多作者论文中占据第一作者或最后一位作者的位置,我们认为他拥有较高的作者地位。

我们首先分析了具有可识别的作者性别的单一作者论文(我们使用了一种算法,该算法利用人口普查数据将作者姓名分类为性别二元[SI附录],同时承认性别是一个复杂和多维的社会结构)。就像在更广泛的科学出版中一样(50⇓-52),结果显示,总的来说,女性在两篇文献中发表单一作者论文的可能性明显低于男性。精确的单侧二项式检验表明,开放科学文献中女性单身作者的比例为33.0%,可再现性为28.1%;两者均低于50%--这一比例将表明性别平等(P<;两种测试均为0.001)。这表明,女性在每个主题领域扮演单一作者的角色是平等的,尽管与她们单一作者的男性同事相比,两篇文献中女性的代表性都很低。

对于其余的分析,我们将重点放在多作者论文上。在开放科学文献的多作者论文中,女性拥有较高的作者地位占60.6%,而在可再现性文献中,这一比例为57.9%。请注意,在性别平等的情况下,女性处于高地位(第一或最后)作者位置的多作者论文的预期百分比将为75%(包括女性第一和最后的可能性为25%,女性优先和男性最后的可能性为25%,男性优先和女性最后的可能性为25%)。

我们进行了回归分析,以更好地了解两篇文献中高级作者职位的性别差异。具体地说,我们拟合了控制时间趋势、团队规模和稿件类型的Logistic样条回归模型。

.