Source: The Verge
一项新法案将迫使科技公司披露用于训练他们的AI模型的任何受版权保护的材料。来自加利福尼亚州代表亚当·希夫特(D-CA)的“生成AI版权披露法案”要求,任何制作AI训练数据集的人都需向版权登记机关提交关于数据集内容的报告。报告应包括数据集中受版权保护的材料的详细摘要以及数据集的URL(如果该URL是公开可见的)。这一要求还将扩展到对数据集所做的任何更改。
公司必须在使用训练数据集的AI模型发布之前“不迟于30天”提交报告。该法案不会对现有的AI平台具有追溯效应,除非它们在成为法律后对其训练数据集进行更改。希夫特的法案触及自生成AI兴起以来艺术家、作家和其他创作者一直在抱怨的问题:AI模型经常在未经许可的情况下基于受版权保护的材料进行训练。版权和AI一直是难以驾驭的领域,特别是关于AI模型到底变换或模仿多少受保护内容的问题尚未解决。
艺术家和作家一直在通过诉讼来主张自己的权利。AI模型的开发者声称他们的模型是基于公开可用数据进行训练,但信息的大量性意味着他们并不确切知道哪些数据是受版权保护的。而公司表示,任何受版权保护的材料都属于合理使用。与此同时,许多公司已开始为某些客户提供法律保障,以防他们因侵犯版权而被起诉。
希夫特的法案得到了行业团体的支持,如美国编剧协会(WGA)、美国唱片协会(RIAA)、美国导演协会(DGA)、美国演员联盟 - 美国电视和广播艺人联盟(SAG-AFTRA)和作家协会。在支持者名单中显著缺席的是通常支持保护版权作品免受盗版侵害行动的美国电影协会(MPA)。其他团体也试图为训练数据集引入更多的透明度。Fairly Trained团体希望如果AI模型证明他们要求使用版权数据时征得了许可,他们将为AI模型添加标签。
保护知识产权是关乎创作者利益的重要问题,如何在AI时代维护版权法律的权威性和透明度,需要更多思考与探讨。