智商在很大程度上是一个伪科学的骗局。

2020-05-07 22:33:57

(修订稿:新增对险恶国家侧写的评论。此外,1)使用与研究人员相同的数据,发现尽管存在循环,但智商财富和智商收入的R²实际上是0。2)事实证明,在最好的应用中,智商比随机选择高出不到6%,通常是2%,因为相关性的计算有一个缺陷,心理学家似乎不知道相关性的信息价值,比如“我能获得多少关于B知道A的信息”和误差传播(单个人的测试内方差)。3)补充了显示国民平均智商有效性背后的故事的信息,从统计上讲,这是一个欺诈。那些让我参与这篇文章的心理学家--用冗长的文章--犯了一个错误,他们向我展示了他们得到的最好的东西:拥有最有力的亲智商论点的论文。他们似乎没有领会到噪音/信号在实践中的真正含义。)。

背景:“智商”是一项旨在衡量智力的陈旧测试,但实际上主要衡量的是极端的非智力(学习困难),以及在较小程度上(有很多噪音)的一种智力形式,去掉了二阶效应-一个人在参加由不成熟的书呆子设计的某种考试方面有多好。它是通过否定的,而不是通过肯定的。它是为学习障碍而设计的,而且考虑到那里并不太需要它(见下面的论点),它最终会为考生、洗纸工、听话的IYI(知识分子还是白痴)挑选,不太适合“现实生活”。(事实是,它与一般的无能相关,这使得总体相关性看起来很高,即使它是随机的,请参见图1和图2。)。该领域在数学上对这一概念考虑不周(在厚尾和不对称的情况下,在相关性方面存在严重缺陷;未能正确处理维度;将大脑视为一种工具,而不是一个复杂的系统),似乎是由。

对于种族主义者/优生主义者,人们一心想要表明,根据智商测试=智力,一些人的智力水平较低;那些人对我突然剥夺了他们的一个“科学”工具感到不安,查尔斯·默里(Charles Murray)等人对推特/诽谤运动最初发布的帖子的激烈反应就是明证。(伟大的卡尔·波普尔(Karl Popper)观察到的一些东西,心理学家倾向于通过将那些逮捕他们的人贴上某种类型的障碍或人格缺陷的标签,如“孩子气”、“自恋”、“利己主义”或类似的东西,来将他们病理化)。请注意,在线杂志Quillette似乎是一个邪恶优生学项目的封面(在“自由思想”的封面下,我称之为“新纳粹”。)。请注意,我在理查德·普洛明(Richard Plomin)的工作中发现了统计学上的缺陷-双胞胎研究的教皇(参见我的技术附录中的相关性的不可递性;他没有理解)。

心理测量学的小贩们在寻找傻瓜(军队、大公司)时,甚至在技术上都不是一种衡量标准的时候,就会相信“这是心理学上最好的衡量标准”这一论点--它最多解释了某些任务(那些与测试本身相似的任务)2%到13%的表现(见下文对0.5相关性的解释),减去心理学家对数据的处理和统计数据的篡改;它不能满足拥有一项衡量标准所需的单调性和传递性(充其量,它是一种凹形衡量标准)。在80-95%的时间里失败的任何措施都不应该是“科学”的一部分(心理学也不应该是科学的一部分,因为它危险的记录--而不是科学主义,但那是另一回事了)。

从根本上说,这是一种不道德的措施,虽然不起作用,但可能会把人(更糟糕的是,团体)关在盒子里度过他们的余生。

智商和财富等硬指标之间没有显著的统计联系。大多数与智商相关的“成就”都是用圆形材料S.A.来衡量的。官僚主义或学术上的成功,是考生和工薪阶层在类似考试的结构化工作中的必备条件。财富可能不意味着成功,但它是唯一的“硬”数字,而不是一些离散的成就。你可以用30美元买食物,而不是用其他“成功”的公司。地位、社会地位或与女王自拍。

心理学家没有意识到,智商的影响(如果有的话,忽略圆形)比同一人的智商测试之间的差异(测试和重测之间的相关性是80%)要小,这意味着你就是你,这意味着你对测试结果的解释不到64%。)。

有些人认为智商衡量的是智力--现实世界的结果还来自“智慧”或耐心,或“责任心”,或决策能力或诸如此类的东西。不是的。它甚至没有衡量智力/心智能力。

如果你想检测某人在一项任务上的表现,比如高利贷、网球或随机矩阵理论,就让他/她去做这项任务;我们不需要有概率挑战的心理学家对现实世界的函数进行理论测试。交易员马上就明白了:来自“模拟”票据策略的假设盈馀并不算数。性能=实际。人们头脑中对屏幕上图像的反应是不存在的(除了通过负片)。

如果智商按结构是高斯的(好的,几乎是),如果现实世界的表现是净的、厚尾的(它是),那么智商和表现之间的协方差要么不存在,要么没有信息。它将在样本中显示一个有限的数字,但在统计上不存在-并且度量将高估为可预测性。另一个问题是:当他们说“黑人与标准差相差x倍”时,他们不知道自己在说什么。不同的总体有不同的方差,甚至不同的偏度,这些比较需要更丰富的模型。这些都是非常非常严重的数学缺陷(如果你有这样的缺陷,心理测量学的10亿篇论文就不算数了)。请看我下一本书中的正式待遇。

但智商中的“智力”是由学术心理学家(不是天才)通过统计结构S.A.确定的,就像我们上面提到的“纸交易”一样。我在这里展示的相关性(见图1),他们显然不理解。它确实与非常负面的表现相关(因为它最初是为了检测学习特殊需求而设计的),但是任何衡量标准都会在那里奏效。左尾而不是右尾有效的衡量标准(智商越高,相关性越低)是有问题的。自从著名的Terman纵向研究以来,我们也得到了类似的结果,即使在以后的研究中使用了按摩数据。为了理解这一点,考虑一下,如果某人有精神需求,那么表现和智商测试之间会有100%的相关性。但在更高的水平上,这种表现没有那么好的相关性,不过,心理学家在没有意识到非线性的影响的情况下,会认为是这样的。(作为一种营销论点,统计上的说法是,一个智商为70的人无法证明定理,这一点对于衡量低智商的标准来说是显而易见的--但它们无法揭示有多少智商为150的人在做卑微的工作。因此,“非常低的智商”可能会提供信息,而“非常高的智商”可能比随机表达的更好--它甚至不是一个必要条件。)。

声称智商“衡量的是硬件”而不是软件,这是一种错误的比较。它可以测量一些被认为是有用的任意选择的智力(在测试环境中)。然而,如果你用波普里安-哈耶克的观点看待智力,你就会意识到,要衡量未来的需求,你需要知道未来生态所需的智力技能,这需要对未来生态的可预测性。它还需要一些遍历能力,即走向未来的技能(因此需要精神上的“偏见”才能生存)。例如:你正在设计一辆“高性能”的汽车。玛莎拉蒂将在赛道上表现最好,并在那里击败一只山羊。但是如果你需要穿越科西嘉加里戈河呢?那么山羊将是最理想的。在纽约市的交通中,行人殴打汽车。因此,“性能”的概念需要与特定的环境相关联,并且必须对其进行预测。(脚注:Herb‘s Simon的剪刀概念:一把刀片代表能力,另一把刀片代表情景背景。)。由于“g”的数学缺陷,它不能给出这个问题的一般解决方案。

现实生活:在学术界,学术界和现实世界没有区别,在现实世界里是有区别的。1)当有人在现实世界中问你一个问题时,你首先会专注于“他/她为什么要问我这个?”,这会把你转移到环境中(参见“黑天鹅”中的“胖子托尼VS约翰博士”),并分散你对手头问题的注意力。哲学家们早就知道这个问题了。只有傻瓜没有这种本能。此外,取序列{1,2,3,4,x}。x应该是什么?只有对归纳法一无所知的人才会回答5,就好像它是唯一的答案一样(参见哲学教科书中的古德曼问题或问问你最近的胖子托尼)[注:我们也可以在这里应用维特根斯坦的规则遵循问题,该问题指出,无限数量的函数中的任何一个都与任何有限序列兼容。资料来源:Paul Bogossian]。不仅一无所知,而且还很听话,想要以某种方式思考。2)现实生活从来不会给出明确的问题和明确的答案(大多数问题没有答案;也许智商最糟糕的问题是,它似乎选择了那些不喜欢说“没有答案,不要浪费时间,找其他事情”的人。)3)只有特定类型的人才会把智慧的注意力浪费在课堂/学术问题上。这些都是死气沉沉的官僚主义者,他们可以激发毫无生气的动机。有些人只能关注以下问题

除了技术说明中讨论的相关的不可传递性问题外,相关检验-重测中还存在严重的非线性。想象一下,一台每次测量相差1小时的天文计时器!

研究中的偏见:如果正如心理学家所显示的那样(见图),医学博士和学者倾向于拥有较高的“智商”(略高,但平均水平较高),这在很大程度上是因为你需要在类似于“智商”的测试中取得分数才能进入学校。仅仅存在这样的滤波器就增加了可见均值,降低了可见方差。概率和统计把傻瓜弄糊涂了。

职业商:如果你把智商,从“智商”改名为FQ“职业商”或SQ“工薪商”,那么有些东西就是真的了。它最好地衡量了被限制在线性任务中成为一个好的从属的能力。“智商”对@davidgraeber的“BS工作”有好处。

度量化:如果有人想出一个数字“幸福商”WBQ或“睡眠商”,SQ,试图模仿温度或物理量,你会觉得很荒谬。但是,如果有足够多的学者对它怀有物理嫉妒和种族仇恨,那么它就会成为一项官方措施。

心理学家关于智商有用的争论是这样的:你想让谁给你做脑部手术/你想在你的公司雇佣谁/你会推荐谁,智商为90的人还是智商为130的人是……学术的。嗯,你是根据特定任务的表现来挑选员工的,这应该包括一些筛选。在现实世界中,你根据人们的简历(而不是思维实验中发给你的某个智商号码)面试他们,一旦你有了他们的简历,62个智商的家伙自然就会被淘汰。因此,智商可以选择的唯一想法,即智力残疾的人,在现实生活中已经被淘汰了:他/她不能拥有工程学或医学学位。这就解释了为什么智商是不必要的,使用它是有风险的,因为你错过了爱因斯坦和费曼。

“智商”最能预测军事训练中的表现,相关系数约为0.5(这是循环的,因为招聘不是随机的,训练是另一种测试)。

自从特曼对“天才”进行纵向研究以来,关于智商是否超过了一个门槛,存在着相互矛盾的故事。这些研究人员没有得到的是,这些矛盾来自这样一个事实,即智商测量的方差随着智商的增加而增加。这不是一件好事。

因此[关于大脑的一些推论]认为“某些种族更擅长跑步”的说法已经过时了:心智能力的维度要大得多,其定义与跑步100米短跑不同。

我在这篇文章中没有心理学的参考(除了通过否定的方式,取他们的“最好”):简单地说,这个领域已经破产了。到目前为止,约有50%的研究没有复制,有复制效果的论文效果较弱。这还不算向现实转化不佳的人(心理学论文很有说服力)。P值是如何经常--几乎总是--具有欺骗性的:我的论文arxiv.org/pdf/1603.07532…。

弗林效应不仅应该警告我们智商在某种程度上依赖于环境,而且至少在一定程度上是循环的。

言外之意:心理学家受过肤浅的统计学教育&他们不能把像“相关性”或“解释方差”这样微不足道的东西转化为意义,特别是。在非线性项下(见末尾的文件)。

“最好的衡量标准”骗子:智商让人想起风险骗子坚持卖出“风险价值”、VaR和RiskMetrics说“这是最好的衡量标准”。那个“最好的”措施,不可靠,把他们炸飞了很多很多次。请注意,对于那些跨域有坏的衡量标准总比没有衡量标准要好的那类受骗者。

很多关于物理学家智商的东西都是可疑的,比如自我报告的偏见/测试中的选择。

如果你从古巴比伦/古地中海/埃及来看待北欧,你就会把这些居民当作没有潜力的失败者来看待……。然后看看1600年之后发生了什么。在讨论人口时要小心。

同样的人认为智商是可遗传的,它决定了成功,认为亚洲人的智商比高加索人高,贬低非洲人,然后没有意识到大约一个世纪以来,中国的GDP比西方低一个数量级。

乔纳坦·帕莱森(Jonatan Pallesen)的“黑客作业”,这篇文章充满了错误(以及“经验主义”),由默里等人推动。他没有意识到,人们当然可以从数据中产生“相关性”。正是对这些相关性的解释充满了胡说八道。Pallesen还制造了一些关于我所说的话的谎言,这些谎言已经在在线评论中被发现(例如,我给的测验和使用Log vs X)。

维度诅咒试图识别“智力”基因的一个缺陷。你可以获得单基因性状,而不是多基因(注:动物育种中使用的加法单基因不是多基因)。