Na semana passada, o juiz William Alsup do tribunal federal de São Francisco tomou uma decisão muito aguardada no caso que envolvia três autores, Andrea Bartz, Charles Graeber e Kirk Wallace Johnson, contra a Anthropic, unicornio californiano por trás da IA Claude. Esta decisão, baseada no uso justo, marca uma virada nos debates sobre o uso de obras protegidas para treinar modelos de IA.
Entre 2021 e 2023, a Anthropic baixou mais de 7 milhões de livros pirateados de sites como Books3, LibGen ou PiLiMi. Após tomar consciência dos riscos jurídicos associados às cópias pirateadas, a empresa comprou, a partir da primavera de 2024, centenas de milhares desses livros de forma legal, escaneou-os após remover a encadernação, eliminou os cabeçalhos e rodapés, e depois os destruiu. Ela manteve esses arquivos em sua biblioteca interna mesmo após decidir que alguns não seriam usados para o treinamento de seus modelos Claude ou não o seriam mais no futuro.
Os romances de Bartz, os ensaios de Graeber e os relatos de Johnson fazem parte tanto dos livros pirateados quanto dos comprados legalmente, muitas vezes de segunda mão. Eles moveram esta ação coletiva contra a Anthropic, que usou suas obras sem consentimento ou compensação financeira, por violação de direitos autorais.
Sem resolver todas as questões levantadas por este caso, o juiz Alsup esclareceu dois pontos essenciais. Por um lado, ele considerou que o uso pela Anthropic dos livros legalmente adquiridos, digitalizados e integrados à sua base de treinamento, constituía um uso justo ('fair use') de acordo com a lei americana. O juiz comparou este processo ao de um autor ou pesquisador que se baseia em leituras para produzir um trabalho original, destacando assim a dimensão transformacional do uso. Para ele, a ação dos autores 'não é diferente do que seria se eles se queixassem que o treinamento dos alunos para escrever bem levaria a uma explosão de obras concorrentes'.
Por outro lado, ele distinguiu claramente este tratamento legal do fato de manter versões digitalizadas. Segundo ele, criar uma biblioteca interna a partir de livros roubados não pode ser justificado pelo direito à inovação ou à pesquisa. Esta parte do litígio foi remetida a um julgamento previsto para dezembro, onde a responsabilidade da Anthropic poderia ser comprometida por violação caracterizada dos direitos autorais.
A empresa poderia então enfrentar uma ação coletiva de outra magnitude se o juiz aprovar a inclusão de milhares de autores no processo. Se for certificada, a Anthropic poderia ter que pagar a cada um deles até 150.000 dólares por obra...
Essa decisão histórica, se não for contestada em um possível recurso, pode servir de precedente e influenciar outras disputas em andamento no setor de IA.
