Claude no comando: Anthropic considerada culpada por manter livros pirateados, mas absolvida no treinamento de sua IA

Claude no comando: Anthropic considerada culpada por manter livros pirateados, mas absolvida no treinamento de sua IA

Em resumo : La société Anthropic, qui a utilisé des œuvres protégées pour entraîner son IA Claude, a été jugée par le tribunal de San Francisco sur deux points : l'usage de livres légalement acquis a été considéré comme équitable, mais la conservation de versions numérisées issues de livres piratés pourrait engager sa responsabilité pour atteinte au droit d'auteur. Cette décision influente pourrait impacter d'autres litiges dans le secteur de l'IA.

Na semana passada, o juiz William Alsup do tribunal federal de São Francisco tomou uma decisão muito aguardada no caso que envolvia três autores, Andrea Bartz, Charles Graeber e Kirk Wallace Johnson, contra a Anthropic, unicornio californiano por trás da IA Claude. Esta decisão, baseada no uso justo, marca uma virada nos debates sobre o uso de obras protegidas para treinar modelos de IA.
Entre 2021 e 2023, a Anthropic baixou mais de 7 milhões de livros pirateados de sites como Books3, LibGen ou PiLiMi. Após tomar consciência dos riscos jurídicos associados às cópias pirateadas, a empresa comprou, a partir da primavera de 2024, centenas de milhares desses livros de forma legal, escaneou-os após remover a encadernação, eliminou os cabeçalhos e rodapés, e depois os destruiu. Ela manteve esses arquivos em sua biblioteca interna mesmo após decidir que alguns não seriam usados para o treinamento de seus modelos Claude ou não o seriam mais no futuro.
Os romances de Bartz, os ensaios de Graeber e os relatos de Johnson fazem parte tanto dos livros pirateados quanto dos comprados legalmente, muitas vezes de segunda mão. Eles moveram esta ação coletiva contra a Anthropic, que usou suas obras sem consentimento ou compensação financeira, por violação de direitos autorais.
Sem resolver todas as questões levantadas por este caso, o juiz Alsup esclareceu dois pontos essenciais. Por um lado, ele considerou que o uso pela Anthropic dos livros legalmente adquiridos, digitalizados e integrados à sua base de treinamento, constituía um uso justo ('fair use') de acordo com a lei americana. O juiz comparou este processo ao de um autor ou pesquisador que se baseia em leituras para produzir um trabalho original, destacando assim a dimensão transformacional do uso. Para ele, a ação dos autores 'não é diferente do que seria se eles se queixassem que o treinamento dos alunos para escrever bem levaria a uma explosão de obras concorrentes'.
Por outro lado, ele distinguiu claramente este tratamento legal do fato de manter versões digitalizadas. Segundo ele, criar uma biblioteca interna a partir de livros roubados não pode ser justificado pelo direito à inovação ou à pesquisa. Esta parte do litígio foi remetida a um julgamento previsto para dezembro, onde a responsabilidade da Anthropic poderia ser comprometida por violação caracterizada dos direitos autorais.
A empresa poderia então enfrentar uma ação coletiva de outra magnitude se o juiz aprovar a inclusão de milhares de autores no processo. Se for certificada, a Anthropic poderia ter que pagar a cada um deles até 150.000 dólares por obra...
Essa decisão histórica, se não for contestada em um possível recurso, pode servir de precedente e influenciar outras disputas em andamento no setor de IA.
 
 
 
 

Para entender melhor

O que é o conceito de 'uso justo' na lei americana e como ele se aplica aos modelos de IA?

O 'uso justo' é um princípio da lei de direitos autorais dos EUA que permite o uso limitado de obras protegidas, como para pesquisa ou crítica, sem permissão. Na IA, é usado para justificar o treinamento de modelos com obras digitalizadas, desde que o uso seja transformador.

Qual é a diferença entre o uso justo de obras digitalizadas e a criação de uma biblioteca digital com livros pirateados?

O uso justo permite o uso de obras digitalizadas para inovação, desde que seja adicionado valor transformador. No entanto, criar uma biblioteca a partir de livros pirateados continua sendo ilegal, pois viola as leis de direitos autorais, apesar das intenções de pesquisa ou inovação.