OpenAI, Google, Meta是否"刀"AI训练数据?

2024-05-11 科技汇总

Source: Slashdot

当OpenAI在2021年用完英语训练数据后发生了什么？他们开发了一个语音识别工具，可以转录YouTube视频的音频，指出技术公司“包括OpenAI、Google和Meta在寻找AI训练数据方面有所疏忽、无视公司政策和辩论屈服于法律。一些OpenAI员工讨论了这一举动可能违反YouTube规定的问题，据了解有知情人说。属于Google的YouTube禁止将视频用于与视频平台“独立”无关的应用。最终，一个OpenAI团队转录了超过100万小时的YouTube视频，据了解。团队中包括OpenAI的总裁Greg Brockman，据两名知情人说，他亲自帮助收集视频。

随后，这些文本被输入名为GPT-4的系统… Meta公司，拥有Facebook和Instagram，去年经理、律师和工程师讨论了购买出版社Simon & Schuster以获取长篇作品，根据时报获得的内部会议录音。他们还就从互联网收集受版权保护的数据进行了讨论，即使需要面对诉讼。他们表示与出版商、艺术家、音乐家和新闻业者协商许可将需要太长时间。与OpenAI类似，据了解Google转录了YouTube视频以获取文本用于其AI模型的五名人士说。

这可能侵犯了视频的版权，这些版权属于其创作者。去年，Google还扩大了其服务条款。据获悉公司隐私团队成员和时报查看的内部消息称，其中一个改变的动机是允许Google能够利用公开可用的谷歌文档、Google地图上的餐厅评论和其他在线材料用于更多的AI产品… 据了解这两家公司的人说，一些Google员工知道OpenAI提取了YouTube视频的数据。但由于Google曾使用YouTube视频的抄本来训练其AI模型，这些人说，他们并未阻止OpenAI。

这一做法可能侵犯了YouTube创作者的版权。因此，如果Google对OpenAI大惊小怪，可能会引起对其自身方法的公众强烈抗议，这些人说。文章补充称，一些科技公司现在甚至正在开发“合成”信息来训练AI。这不是人类创建的有机数据，而是AI模型生成的文本、图像和代码，换句话说，这些系统从它们自己生成的内容学习。

科技发展日新月异，AI数据获取方式牵涉版权问题，引发思考未来数据合规发展路径。" } ```

特别声明：本文及配图均为用户上传或者转载，本文仅代表作者个人观点和立场，不代表平台观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本平台不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。如发现稿件侵权，或作者不愿在本平台发布文章，请版权拥有者通知本平台处理。
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to info@microheadline.com

来源：https://tech.slashdot.org/story/24/05/11/0352201/did-openai-google-and-meta-cut-corners-to-harvest-ai-training-data?utm_source=rss1.0mainlinkanon&utm_medium=feed https://www.nytimes.com/2024/04/06/technology/tech-giants-harvest-data-artificial-intelligence.html https://aiin.healthcare/topics/artificial-intelligence/well-ai-training-data-running-dry-big-tech-heavyweights-are-taking-extraordinary-measures-deal

更多阅读

OpenAI, Google, Meta是否"刀"AI训练数据?

谷歌的人工智能搜索摘要正式推出广告功能（音频）

Windows 11 2024大更新遗留9GB无法删除的文件（音频）

卡西欧推出复古数字手表超大号桌钟即将发售（音频）

Threads正在开发社区群组功能提升用户互动（音频）

全新福特Expedition增添Android Automotive及半个林肯的全景屏幕（音频）

阿里巴巴、腾讯因北京刺激计划股价回升，科技股创13个月新高

下一代iPhone SE或将取消主页按钮，新增Face ID及Apple Intelligence功能（音频）

微软Windows 11更新：提升能耗管理与Wi-Fi性能（音频）

特朗普的加密平台现已向公众开放——但仅限部分人（音频）

埃隆·马斯克在OpenAI旧总部举办xAI招聘派对

游戏《寂静之地：前路》需要玩家保持安静才能生存

从 AOL Time Warner 到 DirecTV 与 Dish：20 年的媒体合并历史（音频）

谷歌DeepMind科学家因蛋白质研究获诺贝尔化学奖（音频）

美国司法部考虑解散谷歌以应对垄断裁决（音频）

少年成功实现NES俄罗斯方块首次‘重生’，证明无尽游戏是可能的（音频）