对于大规模数据处理的AI公司来说，互联网已经显得太小

2024-04-01 外星人S博士

Source: Slashdot

竞相开发更强大人工智能的公司正迅速接近一个新问题：互联网可能过于狭小以容纳他们的计划。来自一份报告：开放AI、谷歌等公司开发的系统需要更多数据来学习，但质量高的公开数据在网上变得匮乏，同时一些数据拥有者也限制AI公司的访问。一些高管和研究人员认为，行业对高质量文本数据的需求可能在两年内超过供应，从而可能放缓AI的发展。

AI公司正在寻找未开发的信息源，并重新思考如何训练这些系统。开放AI，ChatGPT的制造商，已经讨论过使用公开YouTube视频的转录来训练其下一个模型GPT-5，消息人士透露。公司也在尝试使用由AI生成的合成数据作为训练材料，许多研究人员认为这种方法实际上可能导致严重故障。

这些努力通常是秘密的，因为高管认为解决方案可能是竞争优势。数据是供应短缺的几种必要AI资源之一。运行ChatGPT、谷歌的Gemini和其他AI机器人背后的大型语言模型所需的芯片也很稀缺。

业内领导人担心数据中心的匮乏和所需的电力。AI语言模型是使用从互联网上搜集的文本构建的，包括科学研究、新闻文章和维基百科条目。这些材料被分成标记-单词和单词片段，模型利用它们来学习如何表达类似人类的表达。

AI公司需要更多数据，但互联网资源有限，AI发展或受阻。人工智能时代，如何解决数据和资源稀缺问题？" } ```

特别声明：本文及配图均为用户上传或者转载，本文仅代表作者个人观点和立场，不代表平台观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本平台不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。如发现稿件侵权，或作者不愿在本平台发布文章，请版权拥有者通知本平台处理。
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to info@microheadline.com

来源：https://tech.slashdot.org/story/24/04/01/1445214/for-data-guzzling-ai-companies-the-internet-is-too-small?utm_source=rss1.0mainlinkanon&utm_medium=feed https://www.theverge.com/2024/4/1/24117828/the-internet-may-not-be-big-enough-for-the-llms https://news.ycombinator.com/item%3Fid%3D39892310

更多阅读

对于大规模数据处理的AI公司来说，互联网已经显得太小

Halo未来将使用虚幻引擎5进行开发

波音公司裁员约10%，面临艰难挑战

谷歌正在测试支持扩展的Android版Chrome浏览器（音频）

又一场主要飓风逼近佛罗里达，创造历史上最快强化纪录

马克·扎克伯格成为全球第二富翁超越杰夫·贝索斯

全球半导体销售同比增长20.6%，达到创纪录的531亿美元

iOS和Android安全警报：发现两款支持“猪杀”骗局的应用程序（音频）

Threads平台面临互动诱饵问题，Meta正在采取措施应对（音频）

Imgur调整内容审核政策将成人幽默的表情包不再归类为成熟内容（音频）

使用 WebAssembly 在浏览器中运行 Clang 取得重大进展

NES扩展端口可添加无线手柄支持（音频）

美国法官裁定谷歌必须开放安卓应用商店

英特尔推出Arrow Lake桌面处理器，承诺提升能效（音频）

美国警方鲜少公开使用AI人脸识别技术调查结果

波音计划裁减17000个岗位，占其员工的10%（音频）

对于大规模数据处理的AI公司来说，互联网已经显得太小

Halo未来将使用虚幻引擎5进行开发

波音公司裁员约10%，面临艰难挑战

谷歌正在测试支持扩展的Android版Chrome浏览器（音频）

又一场主要飓风逼近佛罗里达，创造历史上最快强化纪录

马克·扎克伯格成为全球第二富翁 超越杰夫·贝索斯

全球半导体销售同比增长20.6%，达到创纪录的531亿美元

iOS和Android安全警报：发现两款支持“猪杀”骗局的应用程序（音频）

Threads平台面临互动诱饵问题，Meta正在采取措施应对（音频）

Imgur调整内容审核政策 将成人幽默的表情包不再归类为成熟内容（音频）

使用 WebAssembly 在浏览器中运行 Clang 取得重大进展

NES扩展端口可添加无线手柄支持（音频）

美国法官裁定谷歌必须开放安卓应用商店

英特尔推出Arrow Lake桌面处理器，承诺提升能效（音频）

美国警方鲜少公开使用AI人脸识别技术调查结果

波音计划裁减17000个岗位，占其员工的10%（音频）

马克·扎克伯格成为全球第二富翁超越杰夫·贝索斯

Imgur调整内容审核政策将成人幽默的表情包不再归类为成熟内容（音频）