• 微头条

    让本地生活更美好

打开APP

ChatGPT在入门课程中胜过本科生,但在高级课程中表现不佳

2024-06-29 外星人S博士
ChatGPT在入门课程中胜过本科生,但在高级课程中表现不佳

Source: Slashdot

雷丁大学心理学与临床语言科学学院的研究员彼得·斯卡弗进行了一项实验,测试他们的考试系统对AI生成作品的容错性。使用ChatGPT-4,斯卡弗的团队在多个本科心理学模块中提交了30多个AI生成的答案,发现94%的提交未被检测到,近84%的提交比人类同行得分更高。这些发现已经发表在期刊《PLOS ONE》上。Ars Technica报道称:斯卡弗的团队在五个本科模块中提交了AI生成的作品,涵盖了心理学学士学位三年学习过程中所需的课程。作业要求要么是针对简短问题的200字答案,要么是约1500字长的更加精致的文章。考试评分者并不知道这项实验。从某种意义上说,研究中的参与者并不知道自己参与了研究,但我们已经获得了进行下去的必要许可。

斯卡弗声称。较短的提交内容是简单地将考试问题复制粘贴到ChatGPT-4中,并附上一个提示,要求答案不超过160字。文章的获取方式也是类似,但所需字数增加到2000字。通过这种方式设定限制,斯卡弗的团队成功让ChatGPT-4生成了与要求长度相近的内容。斯卡弗表示:“想法是在没有任何编辑的情况下提交这些答案,除了文章之外,我们只进行了最小的格式调整。总体而言,斯卡弗和他的同事将63份AI生成的作品悄然提交到考试系统中。即使没有编辑或掩饰AI使用的努力,94%的作品未被检测到,近84%得到了比随机选择的参加相同考试的学生组(大约高出半个等级)更好的成绩。

我们与对这些考试评分的人进行了一系列的反馈会议,他们都感到很惊讶。斯卡弗说。他们感到惊讶的部分原因是大多数被检测到的那些AI提交并未最终被标记,因为它们太重复或太机械式,而是因为它们太好了。在五个模块中,斯卡弗的团队提交的AI工作有一个模块没有比人类学生得分更高:就在学生离开大学之前学生们参加的最后一个模块。大型语言模型能够模拟人类的批判性思维、分析和整合来自不同来源的知识,但只能在有限的程度上。在大学最后一年,学生们预计提供更深入的见解,并使用更加精致的分析技能。AI并不擅长这一点,这就是为什么学生表现更好的原因,'斯卡弗解释道。

Chat GPT-4得到的所有好成绩都在头两年的考试中获得,那时的问题更容易。但AI不断改进,所以在将来很可能在那些高级作业中得分更高。因为AI正成为我们生活的一部分,我们真的没有办法检测AI作弊,所以我们必须在某个时候将其整合到我们的教育系统中。斯卡弗辩称。他说,现代大学的角色是为学生们的职业生涯做准备,现实是他们毕业后会使用各种AI工具。所以,他们最好知道如何正确地使用AI。

AI的崛起势不可挡,教育界如何应对AI的融入,或许值得深思

特别声明:本文及配图均为用户上传或者转载,本文仅代表作者个人观点和立场,不代表平台观点。其原创性以及文中陈述文字和内容未经本站证实, 对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本平台不作任何保证或承诺,请读者仅作参考, 并请自行核实相关内容。如发现稿件侵权,或作者不愿在本平台发布文章,请版权拥有者通知本平台处理。
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to info@microheadline.com
来源:https://news.slashdot.org/story/24/06/29/005233/chatgpt-outperforms-undergrads-in-intro-level-courses-falls-short-later?utm_source=rss1.0mainlinkanon&utm_medium=feed https://beamstart.com/news/chatgpt-outperforms-undergrads-in-intro-1719610618 https://twitter.com/arstechnica/status/1806806026743591057
更多阅读