新型LLM突破利用模型评估技能（音频）

科技汇总

新型LLM突破利用模型评估技能（音频）

SC Media报道了一种新的大型语言模型（LLMs）越狱方法，该方法利用模型识别和评分有害内容的能力，以欺骗模型生成与恶意软件、非法活动、骚扰等相关的内容。这种被称为“坏利克特评审”的多步骤越狱技术由Palo Alto Networks Unit 42开发和测试，发现其成功率比直接单次攻击提高了60%以上。在实验中，研究人员要求LLMs使用类利克特量表评估某些内容的有害程度，结果显示，在1440个案例中，六种不同“先进”模型的“坏利克特评审”越狱方法的平均成功率达到了71.6%。

打开APP收听

新型LLM突破利用模型评估技能（音频）

谷歌组建AI团队开发‘世界建模’技术，助

微软计划在印度投资30亿美元发展人工智能

华硕ROG Flow Z13游戏平板电脑

HP发布Omen Max 16，称其为最

Alienware重磅推出Area-51

MSI发布Titan Dragon版游戏

MSI推出2025年游戏笔记本，搭载Nv

为Twitch主播准备虚拟AI协助者，实

Razer Blade 16 今年更薄，

约翰迪尔认为无人驾驶拖拉机是解决劳动力短

Nvidia发布下一代RTX 5090和

Amazfit推出全新经济型智能手表Ac

《最后生还者》第二季将于四月首播（音频）

美国首次记录人类禽流感死亡病例（音频）

苹果承诺在AI摘要功能上进行澄清以修正B