ChatGPT在入门课程中胜过本科生，但在高级课程中表现不佳

2024-06-29 外星人S博士

Source: Slashdot

雷丁大学心理学与临床语言科学学院的研究员彼得·斯卡弗进行了一项实验，测试他们的考试系统对AI生成作品的容错性。使用ChatGPT-4，斯卡弗的团队在多个本科心理学模块中提交了30多个AI生成的答案，发现94%的提交未被检测到，近84%的提交比人类同行得分更高。这些发现已经发表在期刊《PLOS ONE》上。Ars Technica报道称：斯卡弗的团队在五个本科模块中提交了AI生成的作品，涵盖了心理学学士学位三年学习过程中所需的课程。作业要求要么是针对简短问题的200字答案，要么是约1500字长的更加精致的文章。考试评分者并不知道这项实验。从某种意义上说，研究中的参与者并不知道自己参与了研究，但我们已经获得了进行下去的必要许可。

斯卡弗声称。较短的提交内容是简单地将考试问题复制粘贴到ChatGPT-4中，并附上一个提示，要求答案不超过160字。文章的获取方式也是类似，但所需字数增加到2000字。通过这种方式设定限制，斯卡弗的团队成功让ChatGPT-4生成了与要求长度相近的内容。斯卡弗表示：“想法是在没有任何编辑的情况下提交这些答案，除了文章之外，我们只进行了最小的格式调整。总体而言，斯卡弗和他的同事将63份AI生成的作品悄然提交到考试系统中。即使没有编辑或掩饰AI使用的努力，94%的作品未被检测到，近84%得到了比随机选择的参加相同考试的学生组（大约高出半个等级）更好的成绩。

我们与对这些考试评分的人进行了一系列的反馈会议，他们都感到很惊讶。斯卡弗说。他们感到惊讶的部分原因是大多数被检测到的那些AI提交并未最终被标记，因为它们太重复或太机械式，而是因为它们太好了。在五个模块中，斯卡弗的团队提交的AI工作有一个模块没有比人类学生得分更高：就在学生离开大学之前学生们参加的最后一个模块。大型语言模型能够模拟人类的批判性思维、分析和整合来自不同来源的知识，但只能在有限的程度上。在大学最后一年，学生们预计提供更深入的见解，并使用更加精致的分析技能。AI并不擅长这一点，这就是为什么学生表现更好的原因，'斯卡弗解释道。

Chat GPT-4得到的所有好成绩都在头两年的考试中获得，那时的问题更容易。但AI不断改进，所以在将来很可能在那些高级作业中得分更高。因为AI正成为我们生活的一部分，我们真的没有办法检测AI作弊，所以我们必须在某个时候将其整合到我们的教育系统中。斯卡弗辩称。他说，现代大学的角色是为学生们的职业生涯做准备，现实是他们毕业后会使用各种AI工具。所以，他们最好知道如何正确地使用AI。

AI的崛起势不可挡，教育界如何应对AI的融入，或许值得深思

特别声明：本文及配图均为用户上传或者转载，本文仅代表作者个人观点和立场，不代表平台观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本平台不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。如发现稿件侵权，或作者不愿在本平台发布文章，请版权拥有者通知本平台处理。
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to info@microheadline.com

来源：https://news.slashdot.org/story/24/06/29/005233/chatgpt-outperforms-undergrads-in-intro-level-courses-falls-short-later?utm_source=rss1.0mainlinkanon&utm_medium=feed https://beamstart.com/news/chatgpt-outperforms-undergrads-in-intro-1719610618 https://twitter.com/arstechnica/status/1806806026743591057

更多阅读

ChatGPT在入门课程中胜过本科生，但在高级课程中表现不佳

埃隆·马斯克希望新超级计算机助力其商业帝国（音频）

Windows PowerShell钓鱼邮件利用虚假CAPTCHA，下载凭证窃取工具（音频）

任天堂提交神秘无线设备申请，究竟是什么新产品？

Evan Prodromou 创立社会网络基金会以发展 Fediverse

OpenAI计划调整结构，Sam Altman将首次获得公司股份（音频）

三星提前发布Galaxy S24 FE预购页面，尚未正式宣布（音频）

谷歌员工隐藏通讯历史或面临严重后果（音频）

明年起可在家接种流感疫苗（音频）

卡罗琳·埃利森因FTX欺诈被判两年监禁，需缴纳110亿美元罚款（音频）

微软安全转型：年度报告揭示变革进展（音频）

索尼PS5 Pro将增强七款游戏表现，售价700刀（音频）

亚马逊被控虚假承诺被动收入，导致客户遭受死亡威胁（音频）

迪士尼正式启动密码共享打击计划，推出付费共享程序（音频）

美国数据中心租赁提升商业地产发展新趋势（音频）

内部谷歌邮件在反垄断审判中被提及（音频）