
一项BBC昨日发布的研究发现,AI新闻摘要工具常常生成不准确或误导性的总结,51%的回答存在显著问题。该研究关注OpenAI的ChatGPT、微软的Copilot、谷歌的Gemini和Perplexity助手,评估它们提供关于新闻的准确回答以及是否忠实呈现BBC新闻故事。 助手在研究期间获得了BBC网站的访问权限,并被问及100个新闻相关问题。调查结果显示,51%的AI回答存在某种形式的重大问题,其中19%的回答引用BBC内容时出现事实错误,13%的引用要么修改了原始来源,要么在引用的文章中不存在。 在四个聊天机器人的表现中,Gemini表现最差,34%的回答存在重大问题,Copilot为27%,Perplexity为17%,而ChatGPT为15%。BBC新闻与时事首席执行官Deborah Turness表示,AI带来的好处不应以扭曲事实的内容为代价。 研究揭示了生成型AI在内容总结方面的不足,即使这些助手直接访问被询问的信息,仍然会不时凭空提取“事实。