得克萨斯州用AI替换成千上万人工阅卷员

2024-04-10 科技汇总

Source: The Verge

本周参加得克萨斯州规定考试的学生成为了一个新人工智能评分系统的试验品，该系统将替代该地区大多数的人工阅卷员。得克萨斯论坛报告称，得克萨斯教育机构正在推出一种使用自然语言处理的“自动评分引擎”，该技术类似于使ChatGPT等聊天机器人能够理解和与用户交流的技术，用于对《得克萨斯州学业准备评估考试》中的开放式问题进行评分。该机构预计通过减少临时人工阅卷员的需要，每年可节省1500万至2000万美元，计划今年雇佣不到2000名阅卷员，而到2023年需要6000名。该考试去年进行了重新设计，包括较少的多项选择题，现在包含多达七倍的开放式问题，得克萨斯教育机构学生评估主任何塞·里奥斯表示，机构“希望保留尽可能多的人工开放式回答，但是这需要大量的时间来评分。

根据得克萨斯教育机构网站上的幻灯片展示，新评分系统是通过对已经进行了两轮人工评分的3000个考试答案进行训练的。一些安全保障措施也已实施 —— 所有电脑评分结果中四分之一将由人类重新评分，而混淆AI系统的答案也将进行人工复核（包括使用俚语或非英语答案）。尽管得克萨斯教育机构对AI的应用持乐观态度，但一些教育工作者并不太热衷于看到其实施。Lewisville独立学区主任洛瑞·拉普表示，当自动评分系统于2023年12月有限地使用时，她所在学区的构造性回答零分数量“急剧增加。

拉普说：“目前我们无法确定是测试问题有问题还是新的自动评分系统有问题。AI评分引擎并不新鲜。《Motherboard》的2019年报告发现，它们被至少21个州以不同程度地使用，尽管得克萨斯教育机构似乎决心避免同样的声誉。

得克萨斯教育机构幻灯片上的小字还强调，其新评分引擎是一个封闭系统，与AI根本不同，“AI是使用渐进学习算法进行自适应的计算机，使数据自身进行编程并基本上自我教授。试图区分它们并不令人惊讶 —— 在线上有不少教师对生成式AI服务如何被用于作弊作业和家庭作业感到绝望。这种新评分系统对学生的评分可能会让他们难以接受，他们可能认为在这里应用了“你受规则，我特例”的规则。

面对教育机构采用人工智能评分系统，如何平衡创新与传统的教育价值观，是一个需要深思的议题。" } ```

特别声明：本文及配图均为用户上传或者转载，本文仅代表作者个人观点和立场，不代表平台观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本平台不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。如发现稿件侵权，或作者不愿在本平台发布文章，请版权拥有者通知本平台处理。
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to info@microheadline.com

来源：https://www.theverge.com/2024/4/10/24126206/texas-staar-exam-graders-ai-automated-scoring-engine https://www.kwtx.com/2024/02/26/making-grade-how-central-texas-public-schools-are-using-artificial-intelligence-chat-bots-classroom/ https://www.texastribune.org/2024/04/09/staar-artificial-intelligence-computer-grading-texas/

更多阅读

得克萨斯州用AI替换成千上万人工阅卷员

美国南区检察官办公室揭露碳信用市场的多年欺诈计划（音频）

美国最大的水务公司American Water遭遇网络攻击，威胁水资源安全

Cruise因未报告机器人出租车撞伤行人被罚150万美元（音频）

三星与Ashley家具合作推出智能家居体验（音频）

OpenAI董事长Bret Taylor谈人工智能代理、监管及科技热潮（音频）

中国黑客入侵美国ISP揭示苹果关于后门的立场为何正确

波士顿工程师自制全画幅相机，项目开源分享（音频）

OpenAI董事长Bret Taylor谈人工智能代理、监管及科技热潮

Mozilla发布Firefox 131，新增标签预览和文本特定链接功能

FEMA将虚假信息列为灾害管理新挑战

Windows 11 2024大更新遗留9GB无法删除的文件

备受喜爱的解谜游戏《Golden Idol》续集将于11月发布

备受喜爱的解谜游戏《Golden Idol》续集将于11月发布（音频）

腾讯与吉利莫家族考虑收购育碧，股价暴跌54%

Arc的“更好移动浏览器”现已在Android平台上上线