Claude aan het roer: Anthropic schuldig bevonden aan het bewaren van illegaal gedownloade boeken, maar vrijgesproken voor het trainen van zijn AI

In kort : Het bedrijf Anthropic, dat beschermde werken gebruikte om zijn AI Claude te trainen, werd door de rechtbank van San Francisco op twee punten beoordeeld: het gebruik van legaal verkregen boeken werd als eerlijk beschouwd, maar het bewaren van gedigitaliseerde versies van illegaal gedownloade boeken kan leiden tot aansprakelijkheid voor auteursrechtenschending. Deze invloedrijke beslissing kan andere geschillen in de AI-sector beïnvloeden.

Afgelopen week heeft rechter William Alsup van de federale rechtbank van San Francisco een langverwachte beslissing genomen in de zaak tussen de drie auteurs Andrea Bartz, Charles Graeber en Kirk Wallace Johnson tegen Anthropic, de Californische unicorn achter de AI Claude. Deze uitspraak, gebaseerd op het principe van eerlijk gebruik, markeert een keerpunt in de debatten over het gebruik van beschermde werken voor het trainen van AI-modellen.

Tussen 2021 en 2023 heeft Anthropic meer dan 7 miljoen illegaal gedownloade boeken van sites als Books3, LibGen of PiLiMi gedownload. Na bewustwording van de juridische risico's verbonden aan de illegale kopieën, heeft het bedrijf vanaf het voorjaar van 2024 legaal honderden duizenden van deze boeken gekocht, de kaften verwijderd, de boeken gescand, de kop- en voetteksten verwijderd en ze vervolgens vernietigd. Deze bestanden werden in hun interne bibliotheek bewaard, zelfs nadat besloten was dat sommige niet voor het trainen van hun Claude-modellen zouden worden gebruikt of in de toekomst niet meer zouden worden gebruikt.

De romans van Bartz, de essays van Graeber en de verhalen van Johnson maken zowel deel uit van de illegaal gedownloade als legaal aangekochte boeken, vaak tweedehands. Ze hebben deze collectieve rechtszaak aangespannen tegen Anthropic, die hun werken zonder hun toestemming of financiële compensatie heeft gebruikt voor auteursrechtenschending.

Zonder op alle vragen in te gaan die door deze zaak werden opgeworpen, heeft rechter Alsup toch twee essentiële punten verduidelijkt. Enerzijds oordeelde hij dat het gebruik door Anthropic van legaal verkregen, gescande boeken en hun integratie in de trainingsdatabase viel binnen het kader van eerlijk gebruik ('fair use') volgens de Amerikaanse wet. De rechter vergeleek dit proces met dat van een auteur of onderzoeker die zich baseert op lectuur om een origineel werk te produceren, waarbij hij de transformatieve dimensie van het gebruik benadrukte. Voor hem is de rechtszaak van de auteurs "niet anders dan wanneer ze zouden klagen dat het trainen van scholieren om goed te schrijven zou leiden tot een explosie van concurrerende werken".

Anderzijds maakte hij duidelijk onderscheid tussen deze legale behandeling en het bewaren van gescande versies. Volgens hem kan het creëren van een interne bibliotheek op basis van gestolen boeken niet worden gerechtvaardigd door het recht op innovatie of onderzoek. Dit deel van het geschil wordt doorverwezen naar een proces dat gepland is voor december, waar de aansprakelijkheid van Anthropic kan worden vastgesteld voor duidelijke schending van het auteursrecht.

Het bedrijf kan dan te maken krijgen met een collectieve actie van een andere omvang als de rechter de integratie van duizenden auteurs in de rechtszaak goedkeurt. Als dit wordt gecertificeerd, kan Anthropic worden verplicht om elk van hen tot $150.000 per werk te betalen...

Deze historische beslissing, als deze niet wordt verworpen in een mogelijk beroep, zou als precedent kunnen dienen en andere lopende geschillen in de AI-sector kunnen beïnvloeden.

Vertaald van Claude à la barre : Anthropic reconnue coupable d’avoir conservé des livres piratés, mais blanchie sur l’entraînement de son IA

Beter begrijpen

Wat is het concept 'fair use' in de Amerikaanse wetgeving en hoe past het op AI-modellen?

‘Fair use’ is een principe in de Amerikaanse auteursrechtwetgeving dat beperkt gebruik van auteursrechtelijk beschermde werken toestaat, zoals voor onderzoek of kritiek, zonder toestemming. Bij AI wordt het gebruikt om het trainen van modellen met gedigitaliseerde werken te rechtvaardigen, mits het gebruik transformeerbaar is.

Wat is het verschil tussen het eerlijk gebruik van gedigitaliseerde werken en het creëren van een digitale bibliotheek met gepirateerde boeken?

Eerlijk gebruik staat het gebruik van gedigitaliseerde werken voor innovatie toe, mits er transformatieve waarde wordt toegevoegd. Het creëren van een bibliotheek van gepirateerde boeken blijft echter illegaal, omdat het de auteursrechtwetten schendt, ondanks de intenties voor onderzoek of innovatie.