La semaine dernière, le juge William Alsup du tribunal fédéral de San Francisco a rendu une décision très attendue dans l’affaire opposant trois auteurs Andrea Bartz, Charles Graeber et Kirk Wallace Johnson à Anthropic, licorne californienne à l’origine de l’IA Claude. Cette ordonnance, qui se base sur l'usage équitable, marque un tournant dans les débats sur l’usage des œuvres protégées pour entraîner les modèles d’IA.
Entre 2021 et 2023,
Anthropic a téléchargé plus de 7 millions de livres piratés depuis des sites comme Books3,
LibGen ou PiLiMi. Après avoir pris conscience des risques juridiques liés aux copies piratées, l'entreprise a acheté à partir du printemps 2024 légalement des centaines de milliers de ces livres, les a scannés après avoir arraché leur reliure, supprimé les en-têtes, et les bas de page, puis les a détruits. Elle a conservé ces fichiers dans sa bibliothèque interne même après avoir décidé que certains ne seraient pas utilisés pour l'entraînement de ses modèles Claude ou ne le seraient plus à l’avenir
Les romans de Bartz, les essais de Graeber et les récits de Johnson font partie à la fois des livres piratés et achetés légalement, souvent d'occasion. Ils ont intenté ce procès collectif contre
Anthropic qui a utilisé leurs œuvres sans leur consentement ni contrepartie financière pour violation de
droit d'auteur.
Sans trancher l’ensemble des questions soulevées par cette affaire, le juge Alsup a néanmoins clarifié deux points essentiels. D’un côté, il a estimé que l'utilisation par
Anthropic de livres légalement acquis, numérisés et intégrés à sa base d'entraînement, relevait d’un usage équitable (« fair use ») au sens du
droit américain. Le juge a comparé ce processus à celui d’un auteur ou chercheur qui s’appuie sur des lectures pour produire un travail original, soulignant ainsi la dimension transformationnelle de l’usage. Pour lui, le procès des auteurs
"n’est pas différent de ce qu’il serait s’ils se plaignaient que la formation des écoliers à bien écrire entraînerait une explosion d’œuvres concurrentes".
De l’autre côté, il a distingué clairement ce traitement licite au fait de conserver des versions numérisées. Selon lui, créer une bibliothèque interne à partir de livres volés ne peut être excusé par le
droit à l’innovation ou la recherche. Cette partie du litige est renvoyée à un procès prévu en décembre, où la responsabilité d’Anthropic pourrait être engagée pour atteinte caractérisée au droit d’auteur.
L'entreprise pourrait alors devoir affronter une action collective d'une autre ampleur si le juge approuve l’intégration de milliers d’auteurs dans le procès. Si elle est certifiée,
Anthropic pourrait être amené à verser à chacun d'eux jusqu’à 150 000 $ par œuvre...
Cette décision historique, si elle n'est pas démentie lors d'un appel possible, pourrait faire école et influencer d’autres litiges en cours dans le secteur de l’IA.