理解统计能力和显著性检验

2020-11-09 07:17:05

第一类和第二类错误、β,α、p值、功率和效应大小--零假设显著性检验的惯例包含许多奇怪的概念。

关于显著性检验,人们已经说了很多--大多数都是否定的。方法学家不断指出,研究人员曲解了p值。有人说,往好了说,这是一项毫无意义的活动,往坏了说,是对科学发现的阻碍。因此,我认为学生和研究人员正确解读统计测试是极其重要的。这种可视化是为了帮助学生学习统计假设检验。可视化是基于一个样本的Z检验。您可以使用滑块更改采样大小、功率、显著程度和效果大小,以查看采样分布如何更改。

可视化将显示,当d设置为零时,";幂";和";类型II错误";是";-";。然而,I类错误率意味着一定数量的测试将拒绝H0。人们也会忍不住说,这个比例就是测试能力,而教科书和软件往往就是这么做的。一些消息来源还说,当H0等于Ha时,幂是零。我的观点是,当假定的效应是H0参数空间的一个元素时,幂是不被定义的。在这种情况下,POWER函数返回α,因此";POWER";是未定义的。因此,即使POWER函数说5%的测试会拒绝NULL,在这里讨论POWER也是没有意义的。这还意味着,当Ha接近H0幂时,d的小值将接近α。因此,幂的滑块不允许等于或小于α。

此博客上的内容是在抄送许可下免费共享的。如果你喜欢我的作品并想支持它,你可以:

我对目前使用的显著性检验深表怀疑。下面的引语可能会激发你对围绕NHST的争议的兴趣。[零假设显著性检验]有什么问题?嗯,在许多事情中,它没有告诉我们我们想知道的,我们非常想知道我们想知道的,尽管如此,出于绝望,我们仍然相信它会!";

“…。理工科学生的死记硬背训练无疑是有史以来最愚蠢的误入歧途的程序&第34号;

“…。尽管这种方法在我们的应用统计学期刊和教科书中获得了令人惊叹的卓越地位,但它是建立在对理性推理本质的根本误解的基础上的,而且很少(如果有的话)适合科学研究的目的。

“…。在研究过程中一种基本的疏忽的例子&巴坎(1966)

“统计学显著性检验阻碍了科学知识的增长;它从来没有做出过积极的贡献。”

他说:“教科书是错的。教学是错误的。你刚刚参加的研讨会是错的。你所在科学领域最负盛名的期刊是错误的。

这些引用大多摘自尼克森(Nickerson)(2000年)的优秀评论《零假设显著性检验:一场古老而持续的争论的回顾》(Null假说显著性检验:一场古老而持续的争论的回顾)。

如果你有任何建议,在Twitter上给我发一条消息,或者使用我网站上的联系人表格。