英国国家统计监管机构表示,将审查考试监管机构Ofqual用来决定高中生成绩的算法

2020-08-23 08:25:07

国家统计监管机构正在介入审查Ofqual为无法参加考试的学生决定A-level成绩所使用的算法。

一位专家表示,这一过程存在根本性缺陷,考试监督机构选择的算法本质上是作弊的。

在公众的强烈抗议下,政府决定不使用它生成的数据来确定学生成绩。

该算法产生的结果让许多学生不高兴,引发了广泛的抗议,最终被政府抛弃,转而支持教师主导的评估。

英国统计局(OSR)表示,现在将对Ofqual采取的方法进行紧急审查。

报告称,审查将寻求强调从这些史无前例的情况下面临的挑战中吸取教训。

巴斯大学(University Of Bath)机器学习讲师汤姆·海恩斯(Tom Haines)研究了Ofqual发布的文件,概述了算法是如何设计的。

在许多不同的层面上都犯了很多错误。他说,这包括技术上的错误,实施这些概念的人不理解他们输入的数学是什么意思。

作为这一过程的一部分,Ofqual测试了11种不同的算法,任务是预测2019年考试的成绩,并将预测与实际结果进行比较,看看哪种算法产生的结果最准确。

但据海恩斯先生说:他们做错了,实际上他们给了算法2019年的结果--所以他们最终选择的算法基本上是最擅长作弊的算法。

他说,有必要对算法做出决策的过程进行更严格的监督。

几百年前,人们架起了一座桥,只是希望它能行得通。我们不再那样做了,我们检查,我们验证。算法也必须如此。我们还处在几百年前的那个阶段,我们需要认识到这些算法是人为的产物,如果我们不去寻找问题,就会有后果。

作为回应,Ofqual告诉BBC:在整个过程中,我们已经成立了一个专家顾问组,第一次与他们会面是在4月初。

该小组包括从统计和评估界抽调的独立成员。在我们制定标准化方法的细节时,咨询小组提供了建议、指导、洞察力和专业知识。

英国皇家统计学会(RSS)首席执行官斯蒂安·韦斯特莱克告诉BBC,RSS已经向Ofqual提供了两名高级统计学家的帮助。

Ofqual表示,只有当他们签署了一份繁重的保密协议,该协议实际上将禁止他们在长达5年的时间内谈论从这一过程中学到的任何东西,他们才会考虑他们,他说。

鉴于透明和公开是RSS的核心价值,我们觉得我们不能答应。

Ofqual主席罗杰·泰勒(Roger Taylor)也是英国数据伦理与创新中心(Centre for Data道德and Innovation)的主席,该中心由政府设立,旨在为数据驱动技术的治理提供建议。

它向BBC证实,它没有被邀请审查算法或导致它创建的过程,称对组织的算法进行审计不是它的工作。

海恩斯表示:感觉这些机构是由公司和政府创建的,因为他们觉得自己应该拥有这些机构,但他们并没有被赋予实权。

这是一种象征性的姿态,我们需要认识到,道德不是你在任何过程结束时才应用的东西,而是你贯穿始终的东西。

RSS对OSR的审查表示欢迎,并表示希望能从这场惨败中吸取教训。

有技术上的缺陷,但也有设计时的选择,以及它在其下操作的结构。

它必须平衡分数膨胀和个人不公平,虽然分数膨胀很少,但有很多失望的人,这造成了一种明显的不公平感。

这不是一个统计问题,而是关于如何构建算法的选择。

算法被用于社会的各个层面,从非常基本的算法到利用人工智能的复杂例子。

海恩斯表示,大多数算法完全合理、直截了当、定义明确,但他警告称,随着它们在设计上变得越来越复杂,社会需要停下来考虑它想从它们身上得到什么。

我们如何处理那些正在做出决策,而不会做出我们认为它们会做出的决策的算法呢?我们如何防范这种情况呢?

没有其他国家像我们这样对待考试。他们不是想出了如何办考试,就是作文得了平均分。归根结底,考试的目的是让学生决定他们的未来,而你不能用算法来实现这一点。