苹果人工智能研究表明大型语言模型缺乏推理能力（音频）

科技汇总

苹果人工智能研究表明大型语言模型缺乏推理能力（音频）

来自苹果公司的人工智能科学家发布的一份新论文显示，基于大型语言模型（如Meta和OpenAI的模型）的引擎仍然缺乏基本的推理能力。他们提出了一个新的基准测试GSM-Symbolic，以帮助其他人衡量各种大型语言模型的推理能力。初步测试发现，查询表述的微小变化会导致显著不同的答案，从而削弱了模型的可靠性。研究调查了数学推理的“脆弱性”，通过添加人类能够理解的上下文信息，但这些信息不应影响解决方案的基本数学。结果显示，即使是添加一句看似相关的信息，也会将最终答案的准确性降低至65%。研究总结指出：“在这个基础上根本无法构建可靠的代理，改变一两个无关的词或添加几条无关的信息都会导致不同的答案。研究强调，语言模型中并不存在正式的推理能力，其行为更多是复杂模式匹配的结果。

打开APP收听

苹果人工智能研究表明大型语言模型缺乏推理能力（音频）

通用汽车将停用Ultium电池品牌，采用

微软资深工程师抛弃制表符，转向空格的背后

FEMA在佛罗里达应对飓风时打击虚假信息

维吉尼亚国会候选人推出AI聊天机器人以应

《无敌战斗女孩》将于11月登陆Adult

任天堂与改装游戏机制作者法庭对抗，无律师

本田Honda Zero首次试驾：一款轻

地球生命将存续多久？未来时间线揭示惊人事

一家初创公司通过脱碳天然气制造更环保的沥

虚拟宇宙高管为何纷纷退出？商业热度降温（

TikTok因涉嫌危害青少年精神健康遭1

科学家呼吁英国人挖掘闲置电子产品以应对铜

为人工智能奠基的科学家荣获诺贝尔物理学奖

GameSir发布Tarantula P

女性健康初创公司Maven Clinic