2020年雇佣数据科学家有什么不同?

2020-08-13 05:13:13

李天辉是数据孵化器的创始人,这是一个为期8周的奖学金,旨在帮助博士和博士后从学术界过渡到行业。此前,他在Foursquare负责货币化数据科学,曾在谷歌(Google)、安德森·霍洛维茨(Andreessen Horowitz)、摩根大通(J.P.Morgan)和D.E.Shaw工作过。

从历史上看,数据科学招聘实践是从软件工程演变而来的。软件工程面试的一个标志是可怕的脑筋急转弯,比如“一架波音747能装多少个高尔夫球?”或者“在白板上实现快速排序算法。”应聘者将为此学习几周或几个月,招聘网站Glassdoor有一个完整的部分专门介绍他们。在数据科学中,传统的编码脑筋急转弯也得到了统计学的补充--“两个掷骰子的和被三整除的概率是多少?”多年来,公司开始意识到这些脑筋急转弯并不是特别有效,并开始减少它们的使用。

取而代之的是,公司正专注于基于项目的数据评估。这些要求数据科学考生分析公司提供的真实数据。基于项目的评估通常更开放,更鼓励探索,而不是只有一个正确的答案。受访者通常会提交代码,并写下他们的结果。无论是在形式上还是在实质上,这些都有许多优势。

首先,数据评估的环境要现实得多。脑筋急转弯不必要地让应试者陷入困境,或者迫使他们在白板上笨拙地编码。因为脑筋急转弯的答案很容易在谷歌上找到,所以互联网资源是禁区。在工作中,你不太可能被要求在白板上编程,或者在有人盯着你看的情况下进行心算。令人费解的是,你会在工作时间被拒绝上网。数据评估还允许申请者使用他们喜欢的IDE或编码环境,以更现实的速度完成评估。

工程经理肖恩·格里什(Sean Gerrish)说,“带回家的挑战让你有机会更真实地模拟应聘者在工作中的表现,而不是困惑的面试问题。”格里什著有“智能机器是如何思考的”(How Smart Machines Think)一书。

第二,数据评估的实质也更现实。从设计上讲,脑筋急转弯要么很棘手,要么就是测试知名算法的知识。在现实生活中,人们永远不会用手写这些算法(你会使用互联网上免费提供的几十种解决方案中的一种),工作中遇到的问题也很少以同样的方式棘手。通过向应聘者提供他们可能使用的真实数据,并根据公司实际分享结果的方式组织交付成果,数据项目与实际工作技能更紧密地结合在一起。

业内资深人士、“数据团队”(Data Teams)一书的作者杰西·安德森(Jesse Anderson)是数据评估的铁杆粉丝:“这是一个互惠互利的设置。受访者被给予一个模仿现实世界的战斗机会。经理们更接近于在工作中考察应聘者的工作和能力。基于项目的评估还有一个额外的好处,就是评估书面沟通能力,这在新冠肺炎的在家工作中是一项越来越重要的技能。

最后,书面的技术项目工作可以通过淡化招聘过程中传统但有偏见的方面来帮助避免偏见。带有西班牙裔和非裔美国人名字的简历收到的回调比带有白人名字的简历少。对此,少数族裔应聘者故意“美化”简历以弥补损失。面对面的面试通常依赖于类似的问题直觉。通过强调与工作表现密切相关的评估,面试官可以将精力集中在实际资质上,而不是依赖潜在的有偏见的“本能”。希望接受#BLM和#MeToo而不是标签的公司可能会考虑如何调整他们的招聘流程,以实现更大的平等。

数据评估的确切形式各不相同。在数据孵化器,我们发现超过60%的公司提供带回家的数据评估。这些最好地模拟了实际的工作环境,允许应聘者在家工作几天(通常情况下)。另有大约20%的人需要面试数据项目,应聘者将分析数据作为面试过程的一部分。虽然考生面临着来自这些方面的更大时间压力,但他们也没有感受到不断进行评估的压力。经验丰富的数据科学家、“数据科学手册”(The Data Science Handbook)的作者菲尔德·卡迪(Field Cady)解释说:“带回家的挑战需要很多时间。”“对于考生来说,这是一件很大的家务,(例如)对那些承担不起在挑战上花费太多晚上时间的家庭承诺的人来说,这可能是不公平的。”

为了减少定制数据项目的数量,聪明的应聘者正在先发制人地构建自己的投资组合项目,以展示他们的技能,公司越来越多地接受这些项目来代替定制工作。

依赖老式脑筋急转弯的公司正在消失。在顽固的20%的雇主中,仍然坚持脑筋急转弯的雇主中,大多数是规模更大、更成熟的企业,它们通常适应变化的速度更慢。他们需要认识到,过时的招聘流程不仅看起来古怪,而且还在积极地将应聘者赶走。在最近的一次虚拟会议上,我的一位小组同事是一名数据科学的新员工,他解释说,由于公司糟糕的筛选流程,他拒绝了机会。

如果招聘流程如此过时,团队还能有多强呢?完成数据孵化器数据科学奖学金的博士们也普遍认同这种观点。未能接受新现实的公司正在输掉争夺顶尖人才的战斗。