教育心理学家本杰明·布鲁姆(Benjamin Bloom)发现,使用掌握学习的一对一辅导会导致两西格玛(!)学生成绩的提高。结果被复制。他在论文中指出";2西格玛问题";:我们如何在比一对一辅导更实用(即更具可扩展性)的条件下实现这些结果?
与此相关的是,这项大规模的元分析显示,使用掌握学习的直接教学产生了巨大的(>;0.5 Cohen';SD)效应"然而,尽管有大量研究支持DI的有效性,但它并没有被广泛接受或实施"
本文对布鲁姆';s的两西格玛问题,这反过来又涉及到对教育方法的检查、掌握学习和辅导。我还回顾了基于软件的辅导。稍后,我将介绍一般的教育研究、间隔重复和有意练习,因为这些似乎与本综述的核心主题密切相关,原因在通读后将显而易见。
在这里,我只关心学生在考试中的表现,而不关心教育带来的其他假定好处;我不';Don’不要详细地看是什么让学生保持动力,是什么让他们感觉良好,是什么让他们更有创造力,或者是更好的公民。。我本可以看看成功的长期衡量标准(例如,以后的收入),但我不能';我找不到这样的研究。
作为一般说明,在这里讨论影响大小时,除非另有说明,影响大小是指正在讨论的干预措施与照常进行的业务,使用学校使用的任何教育方法。
几十年前,本杰明·布鲁姆(Benjamin Bloom)发现,个人辅导培养了学生';s相对于基线等级的性能由两个标准差决定,这是一个巨大的1效应。由于1:1的辅导费用非常昂贵,他想知道是否有类似于这种效果的方法适用于更大的教室。找到这样一种方法是";二西格玛问题";。而掌握学习似乎是解决这一问题的有希望的方法。
从上面提到的元分析来看,直接教学是西格弗里德·恩格尔曼在60年代最初开发的一种教学计划,它假设任何学生都可以学习任何给定的材料,并且在
这并不意味着';听起来没什么帮助;幸运的是,美国国家直接教学研究所掌握了更多信息。
DI有四个主要功能,可以确保学生比任何其他可用的课程或技术更快、更有效地学习:
学生们按照他们的技能水平接受教学。当学生开始课程时,每个学生都会接受测试,以确定他们已经掌握了哪些技能,哪些技能需要学习。由此,学生与其他需要学习相同技能的学生一起分组。这些小组是按照适合学生的课程级别而不是学生的年级级别来组织的。
该课程的结构旨在确保对内容的掌握。该项目的组织是为了逐步引入技能,让孩子们有机会学习这些技能,并在被要求学习另一套新技能之前加以应用。每节课只有10%是新材料。每节课剩余90%的内容是复习和应用学生已经学到但需要练习才能掌握的技能。技能和概念单独教授,然后与其他技能集成到更复杂、更高级别的应用程序中。所有教学细节都受到控制,以尽量减少学生的机会#39;误解所教信息,最大限度地增强教学效果。
教学进行了修改,以适应每个学生的学习速度。关于直接投资,一个特别奇妙的部分是,学生们以他们学习的速度重新接受教育或加速学习。如果他们需要更多实践某一特定技能,教师可以在课程中提供额外的指导,以确保学生掌握该技能。相反,如果学生很容易获得新技能,需要提升到下一个水平,学生可以被转移到一个新的位置,以便他们可以继续增加他们已经拥有的技能。
项目在出版前经过实地测试和修订。DI程序在出版前编写和修订的方式上非常独特。所有的DI课程都经过了真实学生的实地测试,并在发布之前根据这些测试进行了修订。这意味着你的学生正在接受的项目已经被证明是有效的。
请注意,直接指令(titlecase)与直接指令(小写)不同,有各种各样的程序有";直接指导";在名称中,比如显式直接指令。除非另有说明,我们';在这篇评论中,我们将讨论直接指导。这两种方法都是以教师为中心的,因为教师被视为是将知识传递给学生的人,而不是在教师的帮助下探索知识的学生。如上所述,直接教学由国家直接教学研究所监管,而直接教学则不受监管。
掌握学习(ML)与直接教学不同,但ML是直接教学的一个组成部分。这也是布鲁姆最初研究的方法之一,所以我们在这篇综述中也研究了ML。一个关键的区别是,ML不需要脚本课程,而DI需要脚本课程。
ML的关键原则就是强迫学生在继续下一节课之前先掌握一节课。在每节课结束时,每月或每周,学生';知识是经过检验的。那些不及格的学生会被安排补习班,他们必须重新参加考试,直到掌握为止。这可以在小组环境中完成,比如Bloom';s最初的掌握学习(LFM)计划,或单独,如凯勒';s的个性化教学系统(PSI),每个学生按照自己的节奏前进。
本文研究的文献都是小样本、非随机试验和高度异质性的结果。
一般来说,辅导很可能没有达到布鲁姆建议的2西格玛水平。同样,它';掌握学习不太可能带来1西格玛的提高。但是,高质量的导师和高质量的软件很可能达到2西格玛的改进和超越。
本文研究的所有方法(掌握学习、直接指导、辅导、软件辅导、刻意练习和间隔重复)都在不同程度上有效,如下所述。
这篇文章涵盖了许多被教授的科目,同样也涵盖了许多群体(特殊教育与普通学校、大学与K-12)。这里报告的效应大小是用作一般指导的平均值。
与其他方法相比,所研究的方法对低技能学生更有效。
所研究的方法适用于所有教育层次,但直接教学除外:没有证据可以判断其在大学层次的有效性。
当设定了明确的目标和需要学习的事实时,这些方法的效果会更好。几乎没有证据表明学习迁移:练习或学习X科目并不能提高X以外的学习成绩。
有一些具有启发性的证据表明,这些方法起作用的根本原因是,在辅导的情况下,这些方法增加了对材料、测试效果和对性能的细粒度反馈的重复暴露。
长期研究倾向于发现淡出效应的证据,效应大小会随着时间的推移而减小。这可能是因为所学的技能没有得到实践。
评估效应大小是否有意义可能很困难。通常的做法如下:
然而,人们应该能够通过使用特定于领域的引用来微调所使用的描述语言。在这种情况下,Hugues&;马修(2019)。因此,我将使用卡夫(2018)改编的量表:
考虑到这一点,以下是主要结果的总结,以及我能找到的支持这些说法的最佳研究。作为比较,我把布鲁姆和#39;调查结果:
*有了非常好的导师和非常好的软件,影响的大小确实可以是巨大的。
**当考虑到一系列事实的狭隘知识,或小学阶段教授的基本技能时,ML和DI对普通人群的影响可能很大,对处境不利的学生的影响可能非常大。
本文开头的荟萃分析有一篇文献综述,指出所有以前的文献、系统综述和荟萃分析都显示了DI的强大积极影响。这不是";结果好坏参半";文学本身就相当令人惊讶,甚至令人怀疑;我很少发现这么好的东西,而且似乎没有争议。
正如模因所说,DI/ML是巅峰教育的样子;你可能不喜欢它,但它';这是事实(就考试分数而言)。
20世纪60年代末,DI被接受为“项目后续”的一部分,这是一项由政府资助的大型研究,比较了20多种不同教育干预措施在多年期间对高贫困社区的效果。全国各地的社区选择了在学校实施的项目,19个不同的地点选择了DI,涵盖了广泛的人口和地理特征。外部评估人员使用各种对比组和分析技术收集和分析结果数据。最终结果表明,DI是唯一对所有结果指标产生显著积极影响的干预措施(Adams,1996年;Barbash,2012年;Bereiter&Kurland,1996年;Engelmann,2007年;Engelmann,Becker,Carnine和Gersten,1988年;Kennedy,1978年)。DI的开发者曾希望项目后续评估人员的结论将导致项目的广泛采用,但各种政治阴谋似乎导致只有少数学者和决策者知道这些发现(Grossen,1996;Watkins,1996)。
其中一些干预措施(我以前从未听说过):直接教学、家长教育、行为分析、西南实验室、银行街、响应式教育、TEEM、认知课程和开放教育。
与传统的学校教学相比,这些课程中的大多数实际上导致了显著较低的成绩。这支持了这样一种观点,即至少在后续衡量的指标上,教育方法的选择很重要。尤其是,表现最差的开放教育听起来像是时髦教师会觉得很酷的东西:
专注于培养孩子对自己学习的责任感。阅读和写作不是直接教授的,而是通过激发交流的欲望。灵活的日程安排、以孩子为导向的选择,以及对强烈的个人参与的关注,都是这种模式的特点。
在荟萃分析中发现的效应大小约为0.5,这在社会科学中被认为是相当高的。
本文还研究了不同研究结果的差异性。由于方法不同,估计可能被夸大,因为伪劣研究过多。但即使控制了你认为可以控制的一切,效果仍然存在,或者他们声称的那样;而控制变量并没有起到什么作用:这似乎是一个非常强大的效果,无论你如何切片数据都会出现。
就荟萃分析而言,这是好的,也许太好了。我想起了Daryl Bem';现在,人们对一些人能够预见未来的可能性进行了臭名昭著的元分析。如果基础文献不好,那么荟萃分析将产生有偏差的估计。
一个广泛的批评,更多的警告是,关于直接教学的文献中有很大一部分是由与国家直接教学研究所(NIDI)有关的人撰写的,包括本文开头的元分析;也就是说,荟萃分析本身没有发现NIDI赞助的研究与其他研究之间的差异。
这里';他是一位教育教授,他说当然,DI的工作方式是';他认为,这是一个缺乏创造力、快乐和自发性的环境。他没有给出证据,之前的荟萃分析也没有对这些数据进行测试。
教育研究员阿尔菲·科恩(Alfie Kohn)从后续研究开始,撰写了一篇评论DI的文章。他还提到,在他引用的一些案例中,DI技术导致学生对材料了如指掌,但无法更深入地理解或概括。
艾普利;达德利·马林(2018)发现DI文学缺乏。他们查看了2002年至2013年间发表的作品,发现这些文献质量很低,声称没有';除了在数量非常有限的情况下,它根本不起作用,效果很小。但他们没有';似乎无法量化这一点,它';这不是一个荟萃分析,他们也没有评论以前的系统评价和荟萃分析,这些分析确实发现了积极的影响。
What Works清算所审查了7项直接教学研究,其中只有一项被认为足够好,可以纳入他们的证据摘要。他们的结论是它没有效果。这项研究是一项随机对照试验,共有164名学龄前儿童(平均年龄~5岁)有学习障碍,智商极低(平均76人)。
可以想象,NIDI人有一个专门的页面来回答上述问题。现在,考虑到WWC没有';I';他们回顾了很多研究,他们确实研究了一个非常非典型的样本;我将忽略这一点,看看更多的研究。
我必须提到,荟萃分析的一位作者与他人合著了一篇论文(Stockton&;Wood,(2016)),他们质疑在评估证据质量时应优先考虑RCT。
在荟萃分析中,表1讨论的效应大小(平均值约为0.5)在该值附近有严格的置信区间。但是,当我们进入表3讨论研究设计对效应大小的影响时,我们发现随机研究的效应是非常负面的,调整初始分数或智商也是如此。样本量本身没有';没有多大影响。
让';让我们看看最好的研究,看看我们发现了什么。他们提到附录中有他们研究的具体研究,但我不能';我无法访问它。
在教育上处于不利地位的寄养儿童。6-13 y.o.使用小组(4名学生)辅导。RCT使用(d)直接(i)施工。
在配对研究中,RCT最高可达1.18。在所有情况下,弱势学生,在1.18的情况下,弱智学生。RCT是一篇未发表的博士论文。
我对其中一些进行了抽样调查,但并不是挑选:出现了一种模式:大多数DI研究都是针对贫困学生的。正如我们';我将在稍后的掌握学习中看到,教育方法对那些技能较低的孩子有更大的影响。在Stockard荟萃分析中,提到了1999年的一篇综述,重点是普通教育,而不是弱势学生,但除了1996年的一本书之外,他们没有引用任何具体的论文,这本书来自DI的创始人亚当斯和恩格曼(1996)。他们发现的平均效应为.87,普通教育和特殊教育之间没有太大差异,而且对成年人的影响更大(超过1西格玛)。
但是,考虑到这种影响是后来的荟萃分析结果的两倍,你会对文献的质量感到好奇。回顾文献后,似乎确实有一些证据表明DI对低技能儿童有影响,这种影响可能不大于0.4。对于普通孩子,我们没有';我没有多少工作要做。这可能是DI没有被广泛采用的原因之一。
最著名的掌握学习的大规模实施是汗学院。有一项RCT正在进行,没有显示出有意义的效果。
由罗伯特·斯莱文(Robert Slavin)维护的最佳证据百科全书是一个收集关于什么在教育中起作用的证据的网站,它对不同的数学教学方法进行了审查,发现在中学/高中没有效果,对小学有更大影响的证据有限。(他们只包括五项研究,效应大小从-0.18到1.08不等)。
鉴于上述情况,这听起来可能令人惊讶。但一种可能的解释是,所有这些研究都没有使用完全相同的方法。通过直接指导,我们有一个机构来规范什么是直接投资,以及如何进行直接投资。通过掌握学习,它';不清楚什么是重要的,什么是不重要的';T
关于掌握学习的元分析文献可以追溯到1983年,这是该时期的最后一项研究,Kulik等人(1990年)发现,能力较差的学生受影响较大(d=0.61),能力较强的学生受影响中等(d=0.4),并指出这两组学生在样本中的差异在统计学上并不显著。这项荟萃分析涵盖了从几周到几个月的课程、K-12教育和大学课程,以及各种科目和掌握水平(ML的一些变体要求完美,其他变体在进入下一单元的测试中可以达到80%)。就像盛开的花朵';在美国的研究中,要求更高的掌握学习方法产生了更好的结果,最大的差异似乎出现在81-90和91-100研究之间。换句话说,将要求从70%提高到80%并不意味着';虽然做的不多,但将其提高到90%或100%(完美)就可以了。重要的是,根据学生的测试方式,结果有很大的不同,我们';在接下来的部分中,我们将返回到。如果只考虑标准化测试,而不是由教师或实验者自己设计的,效果大小很小(0.08),而那些使用实验者/教师制作的测试得到了更令人印象深刻的0.5。如果只包括布鲁姆设计的精通学习计划(learning For mastery,LFM),效果大小将上升到0.59。
Cook等人(2013年)对应用于医学教育的掌握学习进行了研究,涵盖82项研究,发现技能有较大提高(ES=1.29),对患者结果有中等程度的提高(ES=0.73)。研究结果具有高度异质性,因此作者警告说,必须根据具体情况进行解释。如果这是真的,这将是医疗保健的好消息!
在Guskey(2015)对掌握学习最常见的一般评估中,也有利于掌握学习。斯莱文(Slavin,1987)是一个例外,他选择了一部分他认为质量更高的文献,发现几乎没有影响。后来的研究不断发现积极的影响;Guskey将读者3引向Kulik et al.(1990)了解为什么许多人认为Slavin#39;奥巴马的评论并不好。它';这里有必要解释一下斯拉文是什么';他的批评是什么,回答是什么,我';我将在下一节中这样做。我';I’我先完成其他荟萃分析。
Summaedu。org编译其他元分析。奇怪的是,库利克(1983)早期的一项荟萃分析也发现了一个小的效应大小(0.05),与斯莱文在1987年的论文中后来发现的相似。伯爵
......