Source: The Verge
本周参加得克萨斯州规定考试的学生成为了一个新人工智能评分系统的试验品,该系统将替代该地区大多数的人工阅卷员。得克萨斯论坛报告称,得克萨斯教育机构正在推出一种使用自然语言处理的“自动评分引擎”,该技术类似于使ChatGPT等聊天机器人能够理解和与用户交流的技术,用于对《得克萨斯州学业准备评估考试》中的开放式问题进行评分。该机构预计通过减少临时人工阅卷员的需要,每年可节省1500万至2000万美元,计划今年雇佣不到2000名阅卷员,而到2023年需要6000名。该考试去年进行了重新设计,包括较少的多项选择题,现在包含多达七倍的开放式问题,得克萨斯教育机构学生评估主任何塞·里奥斯表示,机构“希望保留尽可能多的人工开放式回答,但是这需要大量的时间来评分。
根据得克萨斯教育机构网站上的幻灯片展示,新评分系统是通过对已经进行了两轮人工评分的3000个考试答案进行训练的。一些安全保障措施也已实施 —— 所有电脑评分结果中四分之一将由人类重新评分,而混淆AI系统的答案也将进行人工复核(包括使用俚语或非英语答案)。尽管得克萨斯教育机构对AI的应用持乐观态度,但一些教育工作者并不太热衷于看到其实施。Lewisville独立学区主任洛瑞·拉普表示,当自动评分系统于2023年12月有限地使用时,她所在学区的构造性回答零分数量“急剧增加。
拉普说:“目前我们无法确定是测试问题有问题还是新的自动评分系统有问题。AI评分引擎并不新鲜。《Motherboard》的2019年报告发现,它们被至少21个州以不同程度地使用,尽管得克萨斯教育机构似乎决心避免同样的声誉。
得克萨斯教育机构幻灯片上的小字还强调,其新评分引擎是一个封闭系统,与AI根本不同,“AI是使用渐进学习算法进行自适应的计算机,使数据自身进行编程并基本上自我教授。试图区分它们并不令人惊讶 —— 在线上有不少教师对生成式AI服务如何被用于作弊作业和家庭作业感到绝望。这种新评分系统对学生的评分可能会让他们难以接受,他们可能认为在这里应用了“你受规则,我特例”的规则。
面对教育机构采用人工智能评分系统,如何平衡创新与传统的教育价值观,是一个需要深思的议题。" } ```