学生们发现他们的考试是由人工智能和简单的作弊方式评分的

2020-09-03 18:38:03

周一,达娜·西蒙斯(Dana Simmons)下楼时发现她12岁的儿子拉扎尔(Lazare)在流泪。他已经完成了他七年级历史课上的第一个作业,这是一个虚拟学习的在线平台EdTerity。他得到了满分100分的50分。那不是练习题--这是他真正的成绩。

西蒙斯在接受The Verge的电话采访时说:“他说,我必须在剩下的所有事情上得100分才能弥补这一点。”“他完全灰心丧气了。”

起初,西蒙斯试图安慰她的儿子。西蒙斯自己也是一名历史学教授,她说:“我当时的感觉是,你知道,有些老师一开始给学生打的分数真的很苛刻。”然后,拉扎尔澄清说,他在提交答案后不到一秒就收到了分数。西蒙斯知道,老师不可能在那段时间里读到他的回答--她的儿子正在通过一种算法进行评分。

西蒙斯看着拉扎尔完成了更多的任务。她看了看正确的答案,埃德雷蒂蒂在最后透露了这一点。她猜测,埃德雷蒂尼的人工智能正在扫描预计会在学生答案中看到的特定关键字。她决定玩一玩。

现在,对于每个简短的问题,拉扎尔都会写下两个长句,后面跟着一个不连贯的关键字列表-任何看起来与问题相关的关键字。“问题是像这样的事情……。“君士坦丁堡的位置对拜占庭帝国的权力有什么优势,”西蒙斯说。“所以你会问,好吧,与此相关的可能关键词是什么?财富、大篷车、轮船、印度、中国、中东,他只是把所有这些词都加进去了。“。

拉扎尔告诉The Verge:“我想玩这个游戏,因为我觉得这是一个获得好成绩的简单方法。”他通常从问题所基于的文章或视频中挖掘关键字。

显然,“沙拉”这个词足以让任何一道简答题在教育真实性测试中得到满分。

埃德雷迪斯没有回应多次的置评请求,但该公司的在线帮助中心暗示,这可能是故意的。根据该网站的说法,某些问题的答案如果不包括关键字就会得到0%,如果至少包括一个关键字就会得到100%。其他问题根据包含的关键字数量赚取一定的百分比。

算法更新。他破解了它:两个完整的句子,然后是一个包含所有可能适用的关键字的单词沙拉。每次作业都100%。登录@EdthalityInc的学生们,这是您的机票。他什么也没学就从F升到了A+。

--达娜·西蒙斯(@DanaJSimmons)2020年9月2日。

随着新冠肺炎推动美国各地的学校将教学转移到在线或混合模式,许多学校正在将一些教学和评分外包给虚拟教育平台。EdTerreity为初中生提供300多门在线课程,涵盖了从数学到社会研究,从AP课程到选修课的各种科目。它们由教学视频、虚拟作业以及测试和考试组成。埃德雷蒂斯提供课程,并对作业进行评分。拉扎尔的实际数学和历史课程目前都是通过这个平台进行的-由于大流行,他所在的学区洛杉矶联合学区(Los Angeles Unified School District)完全在线。(该地区拒绝对这篇报道发表评论)。

当然,简答题并不是影响EdTruity成绩的唯一因素-Lazare的课程需要其他格式,包括多项选择题和单字输入。一位熟悉该平台的开发人员估计,简短的答案在EdTerreity的课程内容中所占的比例不到5%,Verge为这篇报道采访的八名学生中,有许多人证实,这样的任务只占他们工作的一小部分。尽管如此,这一策略肯定影响了拉扎尔的班级表现-他现在每项作业都得了100分。

拉扎尔并不是唯一一个玩弄这个系统的人。根据该公司网站的信息,目前有2万多所学校使用该平台,其中包括全国25个最大学区中的20个,两名来自拉扎尔不同高中的学生告诉我,他们发现了类似的作弊方式。他们经常复制问题的文本,并将其粘贴到答案字段中,假设它可能包含相关的关键字。其中一人告诉我,他们整个上学期都在使用这个技巧,“几乎每一次”都得到了满分。

另一名高中生几年前使用过EdTerreity,他说他有时会尝试提交与问题相关的成批单词,“只有在我完全不知情的情况下”。这种方法“经常奏效”。(我们允许一些承认作弊的学生匿名,这样他们就不会惹上麻烦。)。

一名学生告诉我,如果没有这个漏洞,他将无法通过代数2课程。他说,他已经能够找到他的简答题正在寻找的确切关键字或样本答案的列表-他说,你可以在网上“十有八九”找到它们。然而,他没有列出他找到的术语,而是试图在他的每个答案中都加上三个。(他解释说:“任何优秀的作弊者都不会以满分为目标。”

奥斯汀·帕拉迪索(Austin Paradiso)已经毕业,但在高中期间曾在几节课上使用EdTerity,他也不喜欢用词沙拉,但确实使用了几次关键字方法。它在100%的时间里都是有效的。Paradiso说:“我总是试图让答案至少是半连贯的,因为仅仅把一堆关键字扔进输入栏似乎有点便宜。”“但如果我再懒一点,我很容易就能随便写一串与问题提示相关的单词,就能拿到百分之百的分数。”