Claude no comando: Anthropic considerada culpada por manter livros pirateados, mas absolvida no treinamento de sua IA

Na semana passada, o juiz William Alsup do tribunal federal de São Francisco tomou uma decisão muito aguardada no caso que envolvia três autores, Andrea Bartz, Charles Graeber e Kirk Wallace Johnson, contra a Anthropic, unicornio californiano por trás da IA Claude. Esta decisão, baseada no uso justo, marca uma virada nos debates sobre o uso de obras protegidas para treinar modelos de IA.

Entre 2021 e 2023, a Anthropic baixou mais de 7 milhões de livros pirateados de sites como Books3, LibGen ou PiLiMi. Após tomar consciência dos riscos jurídicos associados às cópias pirateadas, a empresa comprou, a partir da primavera de 2024, centenas de milhares desses livros de forma legal, escaneou-os após remover a encadernação, eliminou os cabeçalhos e rodapés, e depois os destruiu. Ela manteve esses arquivos em sua biblioteca interna mesmo após decidir que alguns não seriam usados para o treinamento de seus modelos Claude ou não o seriam mais no futuro.

Os romances de Bartz, os ensaios de Graeber e os relatos de Johnson fazem parte tanto dos livros pirateados quanto dos comprados legalmente, muitas vezes de segunda mão. Eles moveram esta ação coletiva contra a Anthropic, que usou suas obras sem consentimento ou compensação financeira, por violação de direitos autorais.

Sem resolver todas as questões levantadas por este caso, o juiz Alsup esclareceu dois pontos essenciais. Por um lado, ele considerou que o uso pela Anthropic dos livros legalmente adquiridos, digitalizados e integrados à sua base de treinamento, constituía um uso justo ('fair use') de acordo com a lei americana. O juiz comparou este processo ao de um autor ou pesquisador que se baseia em leituras para produzir um trabalho original, destacando assim a dimensão transformacional do uso. Para ele, a ação dos autores 'não é diferente do que seria se eles se queixassem que o treinamento dos alunos para escrever bem levaria a uma explosão de obras concorrentes'.

Por outro lado, ele distinguiu claramente este tratamento legal do fato de manter versões digitalizadas. Segundo ele, criar uma biblioteca interna a partir de livros roubados não pode ser justificado pelo direito à inovação ou à pesquisa. Esta parte do litígio foi remetida a um julgamento previsto para dezembro, onde a responsabilidade da Anthropic poderia ser comprometida por violação caracterizada dos direitos autorais.

A empresa poderia então enfrentar uma ação coletiva de outra magnitude se o juiz aprovar a inclusão de milhares de autores no processo. Se for certificada, a Anthropic poderia ter que pagar a cada um deles até 150.000 dólares por obra...

Essa decisão histórica, se não for contestada em um possível recurso, pode servir de precedente e influenciar outras disputas em andamento no setor de IA.

Marie-Claude Benoit

Redação ActuIA — notícias, dados e análises sobre inteligência artificial para os decisores.

Claude no comando: Anthropic considerada culpada por manter livros pirateados, mas absolvida no treinamento de sua IA

O que Poppy, a IA generativa da Califórnia, ensina à administração europeia

Enquanto a França debate a soberania em IA, Portugal já entregou a sua por 7 M€

AI Act: a contagem regressiva começou para as empresas antes de 2 de agosto de 2026