• 微头条

    让本地生活更美好

打开APP

Google Books开展对AI生成作品的索引

2024-04-05 科技汇总
Google Books开展对AI生成作品的索引

Source: The Verge

Google Books,作为学术界不可或缺的索引工具,开始对低质量作品进行索引,可能影响其语言追踪工具Ngram的信息提供方式。根据404Media报道,Google Books包括一些AI可能写作的书籍。报道披露了通过搜索“as of my last knowledge update”这个ChatGPT等聊天机器人常用短语查找Google Books。

结果显示,搜索结果的前几页大多是关于AI的著作,但也有一些看起来像是机器人写作的作品。404Media称发现的书籍,如Tristin McIver的《Bears, Bulls, and Wolves: Stock Trading for the Twenty-Year-Old》,看起来像是从维基百科中获取有关金融事件的信息并包含了“as of my last knowledge update”这个句子。其他关于Twitter等主题的书籍仍然包含了2021年的信息,而有些AI模型最后接受训练数据是在2021年。

Google Books提供大部分支持其Ngram查看器的数据,Ngram作为一项追踪语言演变方式的研究工具,从书面作品获取信息展示语言如何演变。Google Books扫描和索引可以追溯到1500年代的书面作品,而Ngram最后更新的引用数据是在2019年。

虽然Ngram并非完美,但许多语言学家和其他学者都会使用这个工具进行研究。Google告诉404Media,最近的Google Books作品不会出现在Ngram的结果中,但这些作品可能会在未来的数据更新中出现。

探讨AI生成作品在Google Books中被索引的现象,引发对科技发展对文学价值和数据可信性的思考。

特别声明:本文及配图均为用户上传或者转载,本文仅代表作者个人观点和立场,不代表平台观点。其原创性以及文中陈述文字和内容未经本站证实, 对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本平台不作任何保证或承诺,请读者仅作参考, 并请自行核实相关内容。如发现稿件侵权,或作者不愿在本平台发布文章,请版权拥有者通知本平台处理。
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to info@microheadline.com
来源:https://www.theverge.com/2024/4/5/24122077/google-books-ai-indexing-ngram https://www.cnn.com/2023/08/10/tech/ai-generated-books-amazon/index.html https://www.reddit.com/r/books/comments/16uuyqi/biggest_act_of_copyright_theft_in_history/
更多阅读