Source: Slashdot
Meta发布了其ChatGPT的竞争对手Meta AI,声称其运行在最新、最优秀的AI模型Llama 3上,该模型使用了一份数据集,比Llama 2大7倍,包括4倍的代码。
但对于训练数据的具体来源,Meta则毫不透露。
公司表示,其训练使用的15万亿标记来自'公开可用的来源',包括AI生成的数据或合成数据,但没有提供更具体的信息。
合成数据的使用可能加剧人工智能的现有问题,读者有必要审慎对待AI模型的准确性及可靠性。
特别声明:本文及配图均为用户上传或者转载,本文仅代表作者个人观点和立场,不代表平台观点。其原创性以及文中陈述文字和内容未经本站证实,
对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本平台不作任何保证或承诺,请读者仅作参考,
并请自行核实相关内容。如发现稿件侵权,或作者不愿在本平台发布文章,请版权拥有者通知本平台处理。
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios)
posted above belong to the User who shared or the third-party website which the User shared from.
If you found your copyright have been infringed, please send a DMCA takedown notice to
info@microheadline.com
来源:https://tech.slashdot.org/story/24/04/19/1236256/metas-not-telling-where-it-got-its-ai-training-data?utm_source=rss1.0mainlinkanon&utm_medium=feed
https://www.reddit.com/r/privacy/comments/16yrak0/meta_admits_that_it_trains_its_ai_on_your/
https://sherwood.news/tech/meta-wont-tell-you-what-went-into-training-its-new-ai-model-llama-3/