微软新安全系统可捕捉客户AI应用程序中的幻觉

2024-03-28 外星人S博士

Source: The Verge

微软的产品负责人莎拉·伯德在接受《The Verge》采访时表示，她的团队设计了几项新的安全功能，可供Azure客户使用，不需要聘请一组红队来测试他们建立的AI服务。微软表示，这些由LLM驱动的工具可以检测潜在漏洞，监控“可能合理但没有证据支持”的幻觉，并实时阻止恶意提示，适用于在平台上托管任何模型的Azure AI客户。现在，在Azure AI的预览版中可用的三个功能包括：提示屏蔽，用于阻止来自外部文档的提示注入或恶意提示，导致模型违背其训练；基础检测，用于发现和阻止幻觉；安全评估，用于评估模型的漏洞，另外还会很快推出两个功能，用于将模型引导到安全输出和跟踪提示以标记潜在问题用户。无论用户是输入提示还是模型正在处理第三方数据，监控系统都会评估其是否会触发任何被禁止的词汇或隐藏提示，然后再决定将其发送到模型以作回答。

此外，回答模型的系统会查看模型是否产生了不在文档或提示中的信息。针对谷歌Gemini图像，用于减少偏见的滤镜产生了意想不到的效果，这是微软表示其Azure AI工具将实现更自定义控制的领域。伯德承认，人们担心微软和其他公司可能在决定什么对于AI模型来说是合适或不合适，因此她的团队为Azure客户添加了一个方式来切换模型看到和阻止的仇恨言论或暴力内容的筛选。

未来，Azure用户还可以得到一份试图触发不安全输出的用户报告。伯德表示，这使系统管理员可以确定哪些用户是自己团队的红队成员，哪些可能是有更恶意意图的人。伯德表示，安全功能立即添加到GPT-4和其他流行模型，如Llama 2中。

但由于Azure的模型库包含许多AI模型，使用较小、不常使用的开源系统的用户可能需要手动将安全功能指向这些模型。微软一直在利用AI来增强其软件的安全性，尤其是在越来越多的客户对使用Azure访问AI模型感兴趣的情况下。该公司还努力扩大其提供的强大AI模型数量，最近与法国AI公司Mistral达成独家协议，在Azure上提供Mistral Large模型。

AI技术发展的同时，如何确保其安全性与公平性，是我们需要共同思考的重要问题。

特别声明：本文及配图均为用户上传或者转载，本文仅代表作者个人观点和立场，不代表平台观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本平台不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。如发现稿件侵权，或作者不愿在本平台发布文章，请版权拥有者通知本平台处理。
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to info@microheadline.com

来源：https://www.theverge.com/2024/3/28/24114664/microsoft-safety-ai-prompt-injections-hallucinations-azure https://venturebeat.com/ai/microsoft-launches-new-azure-ai-tools-to-cut-out-llm-safety-and-reliability-risks/ https://news.microsoft.com/de-ch/2024/03/28/announcing-new-tools-in-azure-ai-to-help-you-build-more-secure-and-trustworthy-generative-ai-applications/

更多阅读

微软新安全系统可捕捉客户AI应用程序中的幻觉

苹果发布iOS 18.0.1，修复iPhone 16触屏等问题

研究人员声称新技术将AI能耗降低95%

电子游戏配音演员与出版商即将重新谈判

Oura推出全新智能戒指Oura Ring 4，售价349刀，设计与传感器升级

社交媒体上的暴力威胁搅动FEMA应对飓风挑战

Cerebras IPO面临挑战，AI芯片制造商寻求在华尔街推销Nvidia替代品

Google DeepMind科学家因蛋白质研究荣获诺贝尔化学奖

特朗普加密项目启动不顺，网站故障影响代币销售（音频）

Nuio推出新款流动分体人体工学键盘，利用磁力帮助用户找到理想布局

2025年更多高校将关闭，尽管“Ivy Plus”院校申请人数激增（音频）

微软将在2025年终止对Windows 10的安全更新，用户面临更新危机

Meta称NSO应因发现违规而败诉

苹果修复macOS Sequoia中的漏洞解决网络安全工具兼容性问题

马克·扎克伯格成为全球第二富翁超越杰夫·贝索斯（音频）

超过1.5摄氏度将导致不可逆转的气候影响，研究警告（音频）

微软新安全系统可捕捉客户AI应用程序中的幻觉

苹果发布iOS 18.0.1，修复iPhone 16触屏等问题

研究人员声称新技术将AI能耗降低95%

电子游戏配音演员与出版商即将重新谈判

Oura推出全新智能戒指Oura Ring 4，售价349刀，设计与传感器升级

社交媒体上的暴力威胁搅动FEMA应对飓风挑战

Cerebras IPO面临挑战，AI芯片制造商寻求在华尔街推销Nvidia替代品

Google DeepMind科学家因蛋白质研究荣获诺贝尔化学奖

特朗普加密项目启动不顺，网站故障影响代币销售（音频）

Nuio推出新款流动分体人体工学键盘，利用磁力帮助用户找到理想布局

2025年更多高校将关闭，尽管“Ivy Plus”院校申请人数激增（音频）

微软将在2025年终止对Windows 10的安全更新，用户面临更新危机

Meta称NSO应因发现违规而败诉

苹果修复macOS Sequoia中的漏洞 解决网络安全工具兼容性问题

马克·扎克伯格成为全球第二富翁 超越杰夫·贝索斯（音频）

超过1.5摄氏度将导致不可逆转的气候影响，研究警告（音频）

苹果修复macOS Sequoia中的漏洞解决网络安全工具兼容性问题

马克·扎克伯格成为全球第二富翁超越杰夫·贝索斯（音频）