上周,旧金山联邦法院的William Alsup法官对Andrea Bartz、Charles Graeber和Kirk Wallace Johnson三位作者与加州独角兽公司Anthropic之间的案件作出了备受期待的判决,该公司是AI Claude的开发者。此命令基于合理使用原则,标志着在使用受保护作品训练AI模型的辩论中的一个转折点。
2021年至2023年间,Anthropic从Books3、LibGen和PiLiMi等网站下载了超过700万本盗版书籍。在意识到与盗版副本相关的法律风险后,公司从2024年春季开始合法购买了数十万本此类书籍,拆除装订后进行扫描,删除页眉和页脚,然后销毁。即使在决定不再将某些书用于Claude模型的训练后,公司仍然在其内部图书馆中保留了这些文件。
Bartz的小说、Graeber的论文和Johnson的叙述既是盗版书籍的一部分,也是合法购买的,通常是二手的。他们对Anthropic提起了集体诉讼,指控该公司未经同意或财务补偿使用其作品,侵犯了版权。
虽然没有解决此案提出的所有问题,但Alsup法官澄清了两个关键点。一方面,他认为Anthropic使用合法获得的书籍进行数字化并将其整合到训练数据库中属于美国法律意义上的合理使用。法官将这一过程与作者或研究人员依赖阅读来创作原创作品进行了比较,强调了使用中的转变性。他表示,作者的诉讼“与他们声称训练学生写作会导致竞争作品激增并无不同”。
另一方面,他明确区分了这种合法处理与保存数字化版本的行为。他认为,从盗版书籍创建内部图书馆不能被创新或研究权利所原谅。此部分争议被移交至12月的审判,其中Anthropic可能因明确的版权侵权而承担责任。
如果法官批准将成千上万的作者纳入诉讼,并且诉讼被认证,Anthropic可能需要向每位作者支付高达每部作品150,000美元的赔偿。
这一历史性决定,如果在可能的上诉中未被推翻,可能会成为先例,并影响正在进行的其他AI领域的诉讼。
