• 微头条

    让本地生活更美好

打开APP

Perplexity的大规模AI盗窃行为

2024-06-27 外星人S博士
Perplexity的大规模AI盗窃行为

Source: The Verge

在每个炒作周期中,都会出现一些欺骗模式。在最近的加密繁荣中,是“庞氏经济学”和“地毯式抽屉。在自动驾驶汽车领域,是“只剩五年!”在人工智能领域,它是看看你能以多少不道德的事情逃脱处罚。Perplexity正与人进行谈判,试图筹集数亿美元,力图打造一个谷歌搜索的竞争者。虽然Perplexity并非试图创建一个“搜索引擎”——它想要打造一个“答案引擎。这个想法是,你不需要通过大量结果来自己回答问题,而是只需得到Perplexity为你找到的答案。Perplexity首席执行官阿拉温德·斯里尼瓦斯告诉The Verge,“事实和准确性是我们关心的。这意味着Perplexity基本上是高质量资源的骗取中间商。搜索的价值主张最初是通过抓取记者和其他人的工作,谷歌的结果将流量发送到这些资源。但是,通过提供一个答案,而不是指引人们点击到主要来源,这些所谓的“答案引擎”剥夺了主要来源的广告收入——将这些收入留给自己。Perplexity是一群吸血鬼中的一员,包括Arc Search和谷歌本身。

但是Perplexity通过其Pages产品进一步发展,该产品基于这些主要来源创建一个摘要“报告。它不仅仅引述一两个句子直接回答用户的问题,而且正在创建一个整个的聚合文章,并且在主动剽窃其所使用的资源方面是准确的。Forbes发现Perplexity在规避出版物的付费墙,以提供对该出版物对前谷歌首席执行官埃里克·施密特无人机公司进行的调查的摘要。尽管Forbes在一些工作中有限制计数的付费墙,如这次调查则被设置在一个绝对的付费墙后。Perplexity不仅躲过了付费墙,而且几乎没有引用原始调查,并且盗用了原创艺术用于其报告。(对于那些在家一直追踪的人士来说,盗用艺术是侵犯版权的。)聚合并非一种特别新的现象——但Perplexity进行聚合的规模,以及使用原创艺术的侵权行为,相当,嗯,引人注目。为了让每个人平静下来,该公司的首席商业官前往Axios表示,Perplexity正在与出版商开发收入分享计划,并且哎呀呀,为什么每个人对一个仍处于开发阶段的产品如此刻薄呢?在这一点上,Wired加入其中,确认罗布·奈特的发现:Perplexity对Forbes的工作进行的抓取并非例外。事实上,Perplexity一直忽略了显式要求网络爬虫不抓取页面的robots.txt代码。斯里尼瓦斯在Fast Company中回应称,实际上Perplexity并没有忽略robots.txt;它只是使用忽略它的第三方抓取程序。斯里尼瓦斯没有透露第三方抓取程序的名称,并且也没有承诺要求该爬虫停止违反robots.txt。

别人做的”是一个五岁孩子的很好的解释。再考虑进一步的回应。如果斯里尼瓦斯想要做出道德的选择,他在这里有一些选择。选项一是终止与第三方爬虫的合同。选项二是试图说服爬虫遵守robots.txt。斯里尼瓦斯没有承诺采取任何行动,而且在我看来,有一个明显的原因。即使Perplexity本身没有违反代码,它在生效的“答案引擎”中依赖于其他人违反代码。雪上加霜的是,Perplexity抄袭了关于自己的Wired文章——尽管Wired在其文本文件中明确阻止Perplexity。Wired关于这种抄袭的大部分文章是关于法律救济,但我对robots.txt文件中发生的事情很感兴趣。这是一个基于诚意的协议,几十年来一直有效,由于不道德的人工智能公司——没错,Perplexity不是唯一一个——正在吸收几乎一切可用来训练他们胡说八道模型的东西,所以现在正在瓦解。还记得斯里尼瓦斯说他致力于“事实性”的吗?我不确定这是真的,因为据福布斯报道,Perplexity现在正在推出人工智能生成的结果和实际的错误信息。

我们看到许多人工智能巨头从事令人质疑合法且可以说不道德的实践,以获得他们想要的数据。为了向投资者证明Perplexity的价值,斯里尼瓦斯建立了一个工具,通过假装是通过研究用API访问的学术研究人员来抓取Twitter。我会给我的[假学术]项目起类似Brin Rank和所有这些东西的名字,”斯里尼瓦斯在Lex Fridman的播客节目中告诉了后者。我猜“Brin Rank”指的是谷歌联合创始人谢尔盖·布林;在我看来,斯里尼瓦斯正在吹嘘他的谎言是多么有魅力和聪明。我并不是在告诉你,Perplexity的基础是谎言,以躲避构建互联网的既定原则。它的首席执行官是。这清楚地阐明了“答案引擎”的实际价值主张。Perplexity无法自行生成实际信息,而是依赖于滥用政策的第三方。这款“答案引擎”是由那些感到无所顾忌的人开发的,每当更方便时就会撒谎,而这种偏好对Perplexity的工作是必要的。所以这是Perplexity在这里的真正创新:打破建立互联网的信任基础。问题是,它的任何用户或投资者在乎吗。

AI公司在获取数据时采取的不当行为引发关注,是否Perplexity的行为会引起用户和投资者的重视值得思考。

特别声明:本文及配图均为用户上传或者转载,本文仅代表作者个人观点和立场,不代表平台观点。其原创性以及文中陈述文字和内容未经本站证实, 对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本平台不作任何保证或承诺,请读者仅作参考, 并请自行核实相关内容。如发现稿件侵权,或作者不愿在本平台发布文章,请版权拥有者通知本平台处理。
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to info@microheadline.com
来源:https://www.theverge.com/2024/6/27/24187405/perplexity-ai-twitter-lie-plagiarism https://www.cnet.com/tech/services-and-software/perplexity-ai-review-imagine-chatgpt-with-an-internet-connection/ https://www.digitaltrends.com/mobile/one-of-our-favorite-ai-apps-just-got-big-update-perplexity-pages/
更多阅读