Source: The Verge
Reddit 首席执行官 Steve Huffman 在与谷歌和 OpenAI 达成协议后,呼吁微软和其他公司支付费用,以继续获取 Reddit 网站的数据。Huffman 在本周的采访中表示:“没有这些协议,我们对于我们的数据如何显示和被用于什么毫无发言权或知情权,这使得我们现在处于阻止那些不愿意达成我们想要的数据使用或者不使用方式的人的困境。他特别指名微软、Anthropic 和 Perplexity 拒绝谈判,称其“阻止这些公司是一件真正令人头疼的事情。近几个月来,Reddit 在与爬虫的斗争中逐渐升级。
7 月初,其 robots.txt 文件更新,以阻止没有协议的网络爬虫。接着人们开始注意到 Reddit 的搜索结果只在 Google 上可见,而不在像必应之类的其他搜索引擎上。Huffman 表示,微软一直在使用 Reddit 的数据训练其人工智能,并在必应搜索结果中总结 Reddit 内容“却没有告诉我们”,Reddit 的数据也通过 Bing API 被售予其他搜索引擎。在采访中,他提到微软人工智能首席执行官 Mustafa Suleyman 最近在会议上说公开的网络数据是“自由软件。
微软、Anthropic 和 Perplexity 表现得好像互联网上的所有内容对他们来说都是免费可用的,”Huffman 说。针对 Reddit 搜索结果最近从必应消失的问题,微软搜索主管 Jordi Ribas 在 X 上表示,“Reddit 已经阻止必应对其进行搜索抓取,支持另一个搜索引擎,并影响必应及其引擎的竞争力。微软发言人 Caitlin Roulston 上周对 The Verge 表示:“我们尊重网站提供的指示,不希望其页面内容被我们的生成式人工智能模型使用。Huffman 指出 OpenAI 最近宣布的 SearchGPT,将能够显示 Reddit 结果,这得益于两家公司今年早些时候达成的交易,这是他想要复制的模式。
Reddit 迄今为止所达成的内容许可协议都不包括其数据的专属用途,发言人 Tim Rathschmidt 表示。通过呼吁许可协议,Reddit 正加入更传统的媒体发行商(包括 The Verge 的母公司 Vox Media)寻求支付让其内容供给生成式人工智能的行列。Huffman 表示:“我认为从搜索引擎的传统价值交换已经发生了改变。微软、Anthropic 和 Perplexity 的发言人在截稿时没有对本文发表评论。
数据分享和隐私问题值得关注,互联网公司之间如何平衡商业利益和用户隐私是一个现代社会亟待解决的问题。