Claude à la barre : Anthropic reconnue coupable d’avoir conservé des livres piratés, mais blanchie sur l’entraînement de son IA

Claude à la barre : Anthropic reconnue coupable d’avoir conservé des livres piratés, mais blanchie sur l’entraînement de son IA

En bref : La société Anthropic, qui a utilisé des œuvres protégées pour entraîner son IA Claude, a été jugée par le tribunal de San Francisco sur deux points : l'usage de livres légalement acquis a été considéré comme équitable, mais la conservation de versions numérisées issues de livres piratés pourrait engager sa responsabilité pour atteinte au droit d'auteur. Cette décision influente pourrait impacter d'autres litiges dans le secteur de l'IA.

La semaine dernière, le juge William Alsup du tribunal fédéral de San Francisco a rendu une décision très attendue dans l’affaire opposant trois auteurs Andrea Bartz, Charles Graeber et Kirk Wallace Johnson à Anthropic, licorne californienne à l’origine de l’IA Claude. Cette ordonnance, qui se base sur l'usage équitable, marque un tournant dans les débats sur l’usage des œuvres protégées pour entraîner les modèles d’IA.
Entre 2021 et 2023, Anthropic a téléchargé plus de 7 millions de livres piratés depuis des sites comme Books3, LibGen ou PiLiMi. Après avoir pris conscience des risques juridiques liés aux copies piratées, l'entreprise a acheté à partir du printemps 2024 légalement des centaines de milliers de ces livres, les a scannés après avoir arraché leur reliure, supprimé les en-têtes, et les bas de page, puis les a détruits. Elle a conservé ces fichiers dans sa bibliothèque interne même après avoir décidé que certains ne seraient pas utilisés pour l'entraînement de ses modèles Claude ou ne le seraient plus à l’avenir
Les romans de Bartz, les essais de Graeber et les récits de Johnson font partie à la fois des livres piratés et achetés légalement, souvent d'occasion. Ils ont intenté ce procès collectif contre Anthropic qui a utilisé leurs œuvres sans leur consentement ni contrepartie financière pour violation de droit d'auteur.
Sans trancher l’ensemble des questions soulevées par cette affaire, le juge Alsup a néanmoins clarifié deux points essentiels. D’un côté, il a estimé que l'utilisation par Anthropic de livres légalement acquis, numérisés et intégrés à sa base d'entraînement, relevait d’un usage équitable (« fair use ») au sens du droit américain. Le juge a comparé ce processus à celui d’un auteur ou chercheur qui s’appuie sur des lectures pour produire un travail original, soulignant ainsi la dimension transformationnelle de l’usage. Pour lui, le procès des auteurs "n’est pas différent de ce qu’il serait s’ils se plaignaient que la formation des écoliers à bien écrire entraînerait une explosion d’œuvres concurrentes".
De l’autre côté, il a distingué clairement ce traitement licite au fait de conserver des versions numérisées. Selon lui, créer une bibliothèque interne à partir de livres volés ne peut être excusé par le droit à l’innovation ou la recherche. Cette partie du litige est renvoyée à un procès prévu en décembre, où la responsabilité d’Anthropic pourrait être engagée pour atteinte caractérisée au droit d’auteur.

L'entreprise pourrait alors devoir affronter une action collective d'une autre ampleur si le juge approuve l’intégration de milliers d’auteurs dans le procès. Si elle est certifiée, Anthropic pourrait être amené à verser à chacun d'eux jusqu’à 150 000 $ par œuvre...

Cette décision historique, si elle n'est pas démentie lors d'un appel possible, pourrait faire école et influencer d’autres litiges en cours dans le secteur de l’IA.
 
 
 
 

Pour mieux comprendre (assisté par l'IA)

Qu'est-ce que le concept de 'fair use' dans le droit américain et comment s'applique-t-il aux modèles d'IA ?

Le 'fair use' est un principe du droit d'auteur américain permettant des utilisations limitées d'œuvres protégées, comme la recherche ou la critique, sans autorisation. Dans le cas de l'IA, il est utilisé pour justifier l'entraînement de modèles avec des œuvres numérisées, à condition que l'utilisation soit transformationnelle.

Quelle est la différence entre l'utilisation équitable des œuvres numérisées et la constitution d'une bibliothèque numérique avec des livres piratés?

L'utilisation équitable permet l'emploi d'œuvres numérisées pour l'innovation à condition qu'il y ait une plus-value transformationnelle. En revanche, créer une bibliothèque à partir de livres piratés reste illégal car cela ne respecte pas les droits d'auteur, malgré des intentions de recherche ou d'innovation.