Claude à la barre : Anthropic reconnue coupable d’avoir conservé des livres piratés, mais blanchie sur l’entraînement de son IA

La semaine dernière, le juge William Alsup du tribunal fédéral de San Francisco a rendu une décision très attendue dans l’affaire opposant trois auteurs Andrea Bartz, Charles Graeber et Kirk Wallace Johnson à Anthropic, licorne californienne à l’origine de l’IA Claude. Cette ordonnance, qui se base sur l'usage équitable, marque un tournant dans les débats sur l’usage des œuvres protégées pour entraîner les modèles d’IA.

Entre 2021 et 2023, Anthropic a téléchargé plus de 7 millions de livres piratés depuis des sites comme Books3, LibGen ou PiLiMi. Après avoir pris conscience des risques juridiques liés aux copies piratées, l'entreprise a acheté à partir du printemps 2024 légalement des centaines de milliers de ces livres, les a scannés après avoir arraché leur reliure, supprimé les en-têtes, et les bas de page, puis les a détruits. Elle a conservé ces fichiers dans sa bibliothèque interne même après avoir décidé que certains ne seraient pas utilisés pour l'entraînement de ses modèles Claude ou ne le seraient plus à l’avenir

Les romans de Bartz, les essais de Graeber et les récits de Johnson font partie à la fois des livres piratés et achetés légalement, souvent d'occasion. Ils ont intenté ce procès collectif contre Anthropic qui a utilisé leurs œuvres sans leur consentement ni contrepartie financière pour violation de droit d'auteur.

Sans trancher l’ensemble des questions soulevées par cette affaire, le juge Alsup a néanmoins clarifié deux points essentiels. D’un côté, il a estimé que l'utilisation par Anthropic de livres légalement acquis, numérisés et intégrés à sa base d'entraînement, relevait d’un usage équitable (« fair use ») au sens du droit américain. Le juge a comparé ce processus à celui d’un auteur ou chercheur qui s’appuie sur des lectures pour produire un travail original, soulignant ainsi la dimension transformationnelle de l’usage. Pour lui, le procès des auteurs "n’est pas différent de ce qu’il serait s’ils se plaignaient que la formation des écoliers à bien écrire entraînerait une explosion d’œuvres concurrentes".

De l’autre côté, il a distingué clairement ce traitement licite au fait de conserver des versions numérisées. Selon lui, créer une bibliothèque interne à partir de livres volés ne peut être excusé par le droit à l’innovation ou la recherche. Cette partie du litige est renvoyée à un procès prévu en décembre, où la responsabilité d’Anthropic pourrait être engagée pour atteinte caractérisée au droit d’auteur.

L'entreprise pourrait alors devoir affronter une action collective d'une autre ampleur si le juge approuve l’intégration de milliers d’auteurs dans le procès. Si elle est certifiée, Anthropic pourrait être amené à verser à chacun d'eux jusqu’à 150 000 $ par œuvre...

Cette décision historique, si elle n'est pas démentie lors d'un appel possible, pourrait faire école et influencer d’autres litiges en cours dans le secteur de l’IA.

Marie-Claude Benoit

Rédaction ActuIA — actualités, données et analyses sur l'intelligence artificielle pour les décideurs.

Claude à la barre : Anthropic reconnue coupable d’avoir conservé des livres piratés, mais blanchie sur l’entraînement de son IA

Anthropic accepte de payer 1,5 milliard de dollars pour éviter un procès à haut risque

Une fuite divulguerait l'intégralité de l'invite système de Claude 3.7 Sonnet

Les États-Unis coupent l'accès aux modèles Fable 5 et Mythos 5 d'Anthropic : un précédent pour la souveraineté IA