Ce lundi 7 septembre, le juge William Alsup du tribunal fédéral de San Francisco sera amené à approuver le projet de règlement à l’amiable entre la licorne californienne d'IA  Anthropic, et un groupe d’auteurs, concernant le litige autour de l’utilisation de leurs œuvres pour entraîner le modèle Claude. L’entreprise a préféré un accord préliminaire à un procès dont les enjeux financiers s’annonçaient colossaux.
 
Entre 2021 et 2023, Anthropic aurait téléchargé plus de 7 millions de livres piratés depuis des sites comme Books3, LibGen ou PiLiMi. Face aux risques juridiques liés à ces copies illicites, l’entreprise a, en 2024, acquis des centaines de milliers de ces ouvrages, souvent d’occasion, qu’elle a ensuite scannés après avoir arraché leur reliure et supprimé en-têtes et bas de page, afin de les conserver dans sa bibliothèque interne.
 
Andrea Bartz, Charles Graeber et Kirk Wallace Johnson sont les trois auteurs qui ont initié ce procès collectif contre Anthropic en 2024 pour violation de droit d'auteur : les romans de Bartz, les essais de Graeber et les récits de Johnson font partie à la fois des corpus piratés et et des exemplaires légalement achetés par l’entreprise. 
 
En juin dernier, le juge Alsup a estimé que l’utilisation de livres légalement acquis, numérisés et intégrés à la base d’entraînement, pouvait relever du fair use au sens du droit américain. En revanche, la constitution d’une bibliothèque à partir de fichiers issus de sites pirates dépassait ce cadre. En juillet, il a autorisé Bartz, Graeber et Johnson à représenter l’ensemble des auteurs d’œuvres piratées depuis LibGen et PiLiMi, excluant toutefois Books3, dans le procès collectif prévu pour le 1er décembre.

Alors qu'un montant de 150 000 $ par œuvre avait été évoqué, Anthropic versera 1,5 milliard de dollars sur 2 ans à un fonds d'indemnisation pour clore l’affaire. Environ 500 000 titres ont été pour l'instant recensés, ce qui représente une moyenne de 3000 $ par livre. Si la liste finale s'allonge, la même base s'appliquera. La société s'engage également à détruire tous les fichiers piratés identifiés dans ses bases.
Si cet accord est rendu effectif, la licorne, startup d'IA la plus valorisée derrière sa rivale OpenAI après une levée de fonds historique de 13 milliards de dollars annoncée la semaine dernière, pourra refermer ce dossier à moindre coût par rapport aux risques encourus...