价值一万亿美元的节目是躺在地上的吗?

2020-06-03 21:24:31

如果你看到一张20美元的钞票躺在人行道上,今天是你的幸运日。如果你看到一张20美元的钞票躺在中央车站的人行道上,你还记得一周前看到过同样的钞票,那就不对劲了。--斯科特·亚历山大(Scott Alexander)。

这就是我目前在世界各地看到的编程工资差距的感觉。让我们看看彭博社(Bloomberg)的编程薪资数据,因为它们是唯一一种足够方便的表格。

乍一看,在很多国家,你可以找到一名程序员为你工作,年薪(平均)低于1万美元,而在其他一些国家,你可以让程序员为你工作,年薪(平均)超过10万美元。

在旧金山湾区和纽约这样的地方,收入在100-15万范围内是相当平均的,但开车100公里,这些数字就减少了一半。

免责声明:请不要将以下任何内容视为对该主题的科学正确的分析,更多地将其视为利用一些容易获取的数据来偶尔验证其假设的主观夸夸其谈。有关我做错了什么的全面分析,请看下面的最后一个标题。

编程工作很愚蠢,很容易移动,而且大多数都可以远程完成。

即使你想辩称远程工作不如办公室工作,你仍然会得到这样一个事实,即低收入国家都是低收入国家,在那里开设办公室是非常便宜的。

肯定有一些理由阻止IBM解雇所有的美国员工,并通过在越南招聘员工来削减90%以上的成本。

最明显的原因可能是我们被法规搞糊涂了。美国和英国的医生非常昂贵,这并不是因为没有人注意到,在其他国家,也有同样熟练的医生收取五分之一的费用(甚至没有人注意到,算法可以用几分钱完成大部分费用)。这是因为在这些国家行医需要通过监管的挑战,这会让卡夫卡觉得自己是一个缺乏想象力的骗子。例如,如果你想从另一个国家从事远程医疗,并开出在美国或英国药店有效的处方,那么这个挑战现在是10倍大小。

不完全是,据我所知,一家公司可以在世界任何地方雇佣程序员作为承包商。即使一家公司不能在其母国做到这一点,它也可以在一个更自由的国家拥有一家子公司来做到这一点。

这可能会增加一些法律麻烦,甚至可能是与会计相关的麻烦,但这似乎并不严重(可以说在某些情况下甚至更少,因为来自其他国家的人可以作为承包商而不是雇员工作)。

很难找到数字来支持这一说法,所以如果你知道或在这方面有更多的经验,请随时在这里反驳我。但在等待进一步的证据之前,我的直觉告诉我,这并不能解释哪怕是一丁点儿的差距。

这里一个明显的论点是,工资可能会受到技能的影响。也许有一些因素混合在一起,导致一些国家拥有比其他国家更好的程序员,所以我们针对特定国家的数据被这一点搞糊涂了。

我不确定所有的因素是什么,但我想你可以把它们归结为智力+教育之类的东西。聪明和善于思考如何成为一名程序员似乎是成为一名优秀程序员的主要前提。

在全球范围内,我们既没有良好的智力指标,也没有良好的教育指标。然而,如果我们下到欧盟层面,我们就会有像样的代理人。文化的同质化,学校课程的标准化,以及PISA考试管理的相对公平,意味着我们可以从PISA中很好地抽样15-16岁的孩子们的数学能力。

将2012年的PISA得分与彭博社的数据结合起来,我们得到了23个国家的数据点。通常情况下,我反对使用例如任意的相关公式来确定关系,但让我们从这一点开始:

考虑到程序员包括30多年前受过教育的人,而PISA当时还不是一件事,这可能并不是很重要。

然而,我们可以取2000到2012年间的平均PISA分数,看看同样的相关性是否成立,这可能表明,如果我们有一些更早的PISA分数,相关性仍然是相似的。即使你不想做这个假设,它也能解释更多的不同之处。

取平均数还有其他问题,但不管怎样,让我们来看看:

因此,如果我们考虑到PISA得分12年的平均水平,相关性会变得更强,从2000年到2012年接受PISA测试的几代人现在都是24岁到36岁。

似乎很明显,进一步回顾只会增加这种相关性。在过去的2000年里,我们越来越接近低收入国家周围的共产主义和法西斯式的独裁统治,这些国家以令人窒息或知识生活而闻名。

欧洲的智商数据讲述了与PISA测试不同的故事,但数据的质量要虚假得多。无论如何,我认为PISA是对更高层次推理能力的测试,再加上责任心和整体教育水平。智商是..。嗯,这是以一种我不信任的相当武断的方式收集的相当武断的衡量标准,特别是在不同类型的测试、文化和世代之间进行概括时更是如此。

我认为乐观的观点是声称这一切或多或少都是由技能来解释的,毕竟回顾过去会增加相关性的强度。同样,这也预示着,2012年PISA得分最高的国家如今的初级软件开发人员薪酬也最高。

收集这样的数字很烦人,但我会从工资等级中随意挑选4个国家:

PISA=技能=薪酬假说似乎不适用于这一样本,因为它可以预测法国和斯威登(2012年PISA得分要低得多)的薪资水平明显低于波兰和芬兰(2012年PISA得分要高得多)。

但我不确定Payscale的数据有多可靠,我错误地假设了他们的工资范围有+/-50%的误差,这可能会使关于芬兰的观察无效。

是否值得整理一个脚本,取消所有初级开发人员的工资,并与当前一代初级开发人员的PISA分数(大致是2013年至2018年的分数)进行比较?也许吧,但是我很懒,对不起。

另一种解释工资差距的理论是迫使聪明人成为程序员的情况。

居住在瑞士的聪明人可能会从事编程,如果他们喜欢的话,但他们也可能从事生物技术、医学研究、工业化学、地球物理、抽象数学或其他许多他们会找到高薪和社会地位的领域。

另一方面,生活在俄罗斯的聪明人大约有两个选择,为国家控制的石油和天然气巨头编程或工作。注意事项在这里适用,但我认为这是一个大致被接受的假设,即与许多其他领域的脑力劳动相比,东欧从事该领域工作的人的地位和薪酬都很高。这通常适用于贫穷国家,因为与其他领域相比,信息技术领域的工资与国际市场的跟踪程度相当高。

这意味着,在例如50%聪明到可以成为程序员的瑞士人中,也许0.x实际上喜欢编码到足以成为程序员,而在波兰,这个数字是3*0.x。因此,最终人们被迫成为低收入国家的开发人员,而在高收入国家,你只能得到真正热爱它的人。热爱某件事的人往往做得更好,所以任何不能用智力和教育来解释的事情都可以用较弱的自我选择来解释。

注:我找不到俄罗斯的数据,我是从上面的图表中手动收集的,因为我无法访问原始数据。

我预计信息和通信技术行业就业人口的百分比与工资呈负相关,但我发现情况恰恰相反。在收入较高的国家,很多人从事IT工作,而在收入最低的国家,从事IT工作的人要少得多。

也许有必要做一个分析,我们将平均IT薪酬与平均工资正常化,看看与其他领域相比,IT领域薪资最低的低IT国家对此有多大影响。

尽管如此,考虑到负相关性是如此强烈,我认为我们不能从这一次中拯救出我们正在寻找的那种效果。

大多数编程公司都是由来自美国和英国的人创办的[需要引用],基本上,所有关于这个主题的优质资源都是英文的[需要引用]。

国际团队用英语进行交流[需要引用],所以说英语的人较少的国家,按照国际标准支付的程序员也会较少。

基于2019年全欧洲的EPI数据,我们发现与一般英语技能->;工资的相关性:

我很好奇的一件事是,如果将2000年至2012年的PISA平均值(我们的智力和教育指标)与EPI(我们的语言技能指标)放在一起,会不会对每个国家的工资有很好的预测能力。

我认为这是一个很好的方法来弄清楚EPI和PISA是从不同的角度看同一件事(智力+教育),还是它们一起形成了一个非常强大的多因果预测模型,并解释了我们的困境。

为了获得更多数据,我将继续假设英国和爱尔兰的EPI为80,略高于荷兰的EPI。(注:这将使上述相关性为0.43-0.03,0.54-0.005)。

嗯,答案可以归结为……。没有。使用百分比误差函数,在k次交叉验证(k=4)中,使用线性回归估计器得到~42%的误差。作为参考,当X仅为0时,误差为~81%。

因此,英语+PISA在预测这一点上总比没有好,但它们并不是故事的全部。事实上,PISA单独使用回归估计器产生约40%的误差,而English使用梯度助推器产生约44%的误差,使用回归产生约61%的误差。

此外,在线性回归、梯度增强和决策树回归之间切换模型也会使误差发生很大变化。这就是我希望看到的,如果我们能适应太多的噪音,并且幸运地穿上了一些型号,而不是其他型号。当然,这也是由于缺乏基于验证集的停止方法(即,当精度开始下降时,设置验证集并停止训练或调整一些超参数以减少过拟合)。

就我们所关心的而言,Pisa和EPI可能在关注同样的事情。

我们以前发现的相关性可能应该被视为不太可能在未来推广(参见多模型可变性论证)。

我总是觉得有趣的一个假设是,像美国和英国这样的国家给孩子和成年人开了很多兴奋剂。也许更广泛地使用兴奋剂会让他们在枯燥但具有智力挑战的任务中占据优势(参见:大多数编程工作)。

我使用莫达非尼的经验告诉我,但我认识的许多聪明人都相信他们,所以我认为值得一看。

我认为值得一试,我在这一点上有点绝望。但事实证明,在这方面基本上没有好的数据,在查看了研究[1]、[2]、[3]、[4]、[5]之后,我得出的结论是,我能获得的最好数据可能只是噪音,不管怎么说,这是我能找到的最好的去年使用数据,指的是使用它们的参与者的百分比:

丹麦-2.5%,德国-2.2%,英国-3.9%,西班牙-2.4%,瑞典-2.6%(第一项研究相关)。

比利时-2.4%,丹麦-0%,德国-2.5%,斯洛伐克-3.5%,西班牙-0.8%,英国-3.1%(第二项研究相关)。

因此,基本上,这个数字差异很大,这取决于队列研究和使用的方法,除非有人对我们关心的成人人口进行更深入的研究,否则我们什么都说不出来。

此外,国家样本太少,人们可能会更幸运地使用质量高得多的美国数据进行这项分析,并将其与每个州的平均工资进行比较。

不管怎么说,我只是出于好奇才运行了关联,没有得到任何关联。

请记住,PISA分数是2012年至2000年薪资和平均水平的一个相当好的预测指标,甚至更是如此。

也许还有另一件事情是PISA没有衡量的,那就是技能方程式的一部分,当它与PISA结合起来时,会有更好的预测能力。

很明显,这里的候选人都是时髦词汇,比如独立、创造力和承担责任的能力等等。然而,PISA分数和英语考试分数是一个相当客观的标记,即使有人试图衡量它们,这些指标也不是。

话虽如此,如果我有时间挖掘一些与创造力相关的分数,或者创建一种得出创造力分数的方法(例如,人均出版的图书+乐队的nr+YouTubers的nr,前两个负向调整平均收入,第三个正向调整),我认为这是一个值得研究的假设。或类似的东西)。

从经济轴的右边移到左边,我们看到了一个最腐败的市场,它只会把钱输送到最富有的人手中,而不是让所有级别的穷人付出代价,因此,全球任何方面的不平等(包括工资)都应该与一个国家已经有多富裕相关。

人均购买力平价是否和其他指标一样好?可能吧。由于我不知道彭博社的数据有多新,我将继续使用2012年的GDP数据,因为我的PISA数据来自2012年。

但是,线性回归会产生21%的误差。更复杂的模型不能很好地拟合数据(因为在培训期间,SkLearning没有足够的想象力来对模型进行内部验证),但考虑到它们都过度拟合,最终的精度最差,我们在这里看到的只是一条直线,我会继续下去,假设线性回归差不多是我们能得到的最好的结果。

如果我们加上PISA分数呢?也许GDP是决定PISA分数的一个因素,但也可能不是,也许GDP(压迫性市场假说)和PISA分数(在有效市场假说下的决定因素)结合起来可以解释所有的差异。

在PISA+GDP插入线性回归模型的情况下运行k=4交叉验证会产生~31%的误差,这比单独使用GDP更糟糕,所以PISA只是让我们的模型过于拟合。我之所以说Pisa是一个令人困惑的问题,是因为请记住,仅Pisa一项就产生了40%的误差,而GDP只产生了21%的误差。

从教育,到英语技能,从能使用计算机的人口的百分比,到水、汽油和建材中铅含量的缺乏,再到更少的逃税,再到创造力,人均GDP都是一个令人困惑的问题。

相反的假设(高技能人口挣得更多钱是高人均GDP的生成者)也可能同样正确,而且似乎更有可能。

如果人均GPD的预测力是~100%(即相关系数接近1,线性回归=>;<;1%的误差),我会承认这可能有点可疑。

目前的情况是,人均国内生产总值似乎很可能是我们关心的其他事情的代表,这些事情可能会导致合理的更高工资,但不包括让我们能够充分解释这种差距的神秘因素。

好吧,这是一个相当愚蠢的分析,但如前所述,这是一个思路,让我们看看在这篇相对有缺陷的地图上,我们是否能看到任何有趣的相关性,而不是我试图得出任何权威的主张。

话虽如此,我认为使用这张有缺陷的世界地图,我们可以假设,至少对欧洲是这样:

人均国内生产总值与英语水平呈显著正相关(p=0.004),与英语水平呈显著正相关(p=8e-5),与Pisa SOR2012-2000年平均水平呈显著正相关(p=0.001)和r=0.67(p=e-5)。

此外,如果我们还考虑PISA分数或EPI排名,GDP决定的关系没有改善,如果我们考虑EPI,PISA决定的关系没有改善。因此,这些因素的预测能力不是累积的,它们的预测成分想必几乎完全相关(尽管需要不同的分析才能最终确定这一点)。

话虽如此,但有几件事我没有考虑过,我认为它们很重要,很难拿到数字:

基本上不可能在这方面得到任何数字,但税收在低收入国家的运作方式往往不同。

我碰巧对东欧的不同地方了解不少,在这里雇人做自由职业者而不是雇员似乎是一种普遍的做法。

让我们以俄罗斯为例,因为我最近出于无关的原因不得不调查这件事,所以随意选择了俄罗斯。

52K美元的工资(根据雇主的成本计算)导致员工只拿到34K美元。另一方面,即使是非常保守的估计,也不会使自由职业者的税金总额超过13%,从而导致支付给员工的税金为45000英镑。

所以这是可以理解的,许多人,特别是许多高薪个人,更喜欢走这条路。即使国有公司不走这条路(在那里处于法律灰色地带),外国公司雇佣自由职业者而不是在当地设立分支机构聘用他们作为员工也是完全合法的,所以我敢打赌,大多数聪明的公司都会走这条路。

除此之外,还有一些做法,比如直接向员工支付部分工资,而不申报(例如手中的现金),这在波兰、意大利或葡萄牙、英国、德国或法国等国更容易接受。

此外,还有可能将编程工作作为IP支付,而不是作为劳动力/服务…。而你已经把自己弄得手足无措了。

此外,考虑到薪资数据不是非常可靠的事实,这可能只会让除了最富有的国家之外的任何国家都陷入一团不太可靠的烂摊子。

如果你认为办公室是必要的,或者至少提供了一些优势,就会产生另一个问题,那就是它们往往位于富裕的地区,因为它们往往位于管理层居住的地区。

谷歌的主要校区位于山景城。为什么?因为他们的大部分高级管理人员都在那里。因此,高层管理人员也开始驻扎在那里。没有一个合格的首相想要离开高层管理,这是职业生涯的自杀,他们也不想离开他们的团队。谷歌有一大笔钱,所以他们可能不会太在意首相想要在山景城以10万美元招聘某人,或者想要重新分配他的团队,以7万美元在其他地方招聘某人。因此,你最终得到的是收入超过10万美元的人,住在山景城的房车里。

这种效应无穷无尽地造就了位于纽约市、旧金山湾区和伦敦的最耀眼的初创企业和公司。然后,下一层位于与这些地方或它们自己的次要枢纽紧密相连的区域中…。等等。

随后,这使得在其他地方设立办公室变得更加困难,因为所有优秀的程序员都在这些中心,他们的朋友和家人都住在那里,他们已经习惯了当地的文化,不想离开。

即使有几个程序员愿意在其他地方工作,让一个大型团队去当地工作最终也会成为一个协调问题,这比仅仅咬紧牙关在一个主要的科技中心招聘要昂贵得多。

同样,很难找到有关以下内容的数据。

..