• 微头条

    让本地生活更美好

打开APP

对于大规模数据处理的AI公司来说,互联网已经显得太小

2024-04-01 外星人S博士
对于大规模数据处理的AI公司来说,互联网已经显得太小

Source: Slashdot

竞相开发更强大人工智能的公司正迅速接近一个新问题:互联网可能过于狭小以容纳他们的计划。来自一份报告:开放AI、谷歌等公司开发的系统需要更多数据来学习,但质量高的公开数据在网上变得匮乏,同时一些数据拥有者也限制AI公司的访问。一些高管和研究人员认为,行业对高质量文本数据的需求可能在两年内超过供应,从而可能放缓AI的发展。

AI公司正在寻找未开发的信息源,并重新思考如何训练这些系统。开放AI,ChatGPT的制造商,已经讨论过使用公开YouTube视频的转录来训练其下一个模型GPT-5,消息人士透露。公司也在尝试使用由AI生成的合成数据作为训练材料,许多研究人员认为这种方法实际上可能导致严重故障。

这些努力通常是秘密的,因为高管认为解决方案可能是竞争优势。数据是供应短缺的几种必要AI资源之一。运行ChatGPT、谷歌的Gemini和其他AI机器人背后的大型语言模型所需的芯片也很稀缺。

业内领导人担心数据中心的匮乏和所需的电力。AI语言模型是使用从互联网上搜集的文本构建的,包括科学研究、新闻文章和维基百科条目。这些材料被分成标记-单词和单词片段,模型利用它们来学习如何表达类似人类的表达。

AI公司需要更多数据,但互联网资源有限,AI发展或受阻。人工智能时代,如何解决数据和资源稀缺问题?" } ```

特别声明:本文及配图均为用户上传或者转载,本文仅代表作者个人观点和立场,不代表平台观点。其原创性以及文中陈述文字和内容未经本站证实, 对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本平台不作任何保证或承诺,请读者仅作参考, 并请自行核实相关内容。如发现稿件侵权,或作者不愿在本平台发布文章,请版权拥有者通知本平台处理。
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to info@microheadline.com
来源:https://tech.slashdot.org/story/24/04/01/1445214/for-data-guzzling-ai-companies-the-internet-is-too-small?utm_source=rss1.0mainlinkanon&utm_medium=feed https://www.theverge.com/2024/4/1/24117828/the-internet-may-not-be-big-enough-for-the-llms https://news.ycombinator.com/item%3Fid%3D39892310
更多阅读