根据最近发表的一项研究,具有白人名字的软件开发人员在 GitHub 上可能比名字被认为是黑人、西班牙裔或亚太岛民的开发人员更成功。该研究结果于今年早些时候发表在 IEEE Transactions on Software Engineering 上,提出了关于 GitHub 和整个开源软件社区缺乏多样性的后果的重要问题。滑铁卢大学的研究人员分析了 GitHub 上 365,607 名开发人员提出的超过 200 万份贡献或“拉取请求”。研究人员使用名为 NamePrism 的 AI 工具分析人们对他们感知的种族和民族的姓名,发现在 GitHub 上被认为是白人通常会增加开发人员的想法被接受的几率。与被视为西班牙裔或亚太岛民的开发商相比,这将这些几率增加了 6% 到 10%。 “从理论上讲,这是一个完全任人唯贤的地方。你在开源软件中看不到一个人。你不太可能见过他们或对他们有意见。你最多知道他们的名称,”滑铁卢大学计算机科学助理教授梅·纳加潘说,他是该研究的合著者。 Nagappan 说,考虑到 GitHub 等开源社区对产品开发的影响,即使在这种环境下,种族偏见可能仍然存在这一事实令人担忧。 “如果我们不听取不同的声音,那么它就会成为由非常同质的人群构建的软件,”他说。不仅如此,GitHub 已经成为软件开发人员的一种投资组合,这意味着这种偏见可能会对开发人员的职业生涯产生不利影响。 Nagappan 说:“如果你的贡献被接受,即使是其中一个大项目,那么作为一名新人,你可以将其转化为在公司的成功职业生涯。” GitHub 没有回应 Protocol 的置评请求,Nagappan 表示,这项研究的目标不是特别针对 GitHub,而是更广泛地解决开源社区的担忧。 Nagappan 表示,这些发现建立在先前的研究之上,该研究发现 GitHub 上被视为女性的开发人员的接受率较低。还发现接受率因开发商的原籍国而异。
他指出,他的团队使用的 NamePrism 工具在预测人们的种族和民族方面并不完美。研究人员仅在该工具具有高度信心时才为开发人员分配种族或民族。对于所有其他人,他们将开发人员的感知种族归类为“未知”。虽然滑铁卢研究人员避免将 GitHub 上的这种种族偏见现象归因于任何特定原因,但他们确实发现,在 GitHub 上贡献想法的大多数开发人员以及对这些贡献做出回应的大多数人都有研究人员估计的名字白色的。此外,他们发现被视为黑人、西班牙裔和亚太岛民的开发人员在响应他们的人属于同一种族或族裔群体时更有可能接受他们的拉取请求。为了纠正这种潜在的偏见,研究人员建议 GitHub 采用单盲或双盲结构,类似于学术界对研究的评估方式。另一个建议是需要多人来评估给定的贡献,这样就不会受到单个人的偏见的干扰。对种族的看法如何影响人们的在线互动的问题并不是 GitHub 独有的。去年,Airbnb 启动了一个名为 Project Lighthouse 的研究项目,该项目还旨在分析种族歧视在平台上的表现,包括人们的名字在扭曲其他用户看法方面所扮演的角色。