W skrócie : Firma Anthropic, która wykorzystała chronione dzieła do szkolenia swojej SI Claude, była sądzona przez sąd w San Francisco w dwóch kwestiach: użycie legalnie nabytych książek uznano za dozwolony użytek, ale przechowywanie zdigitalizowanych wersji z pirackich książek może pociągnąć ją do odpowiedzialności za naruszenie praw autorskich. Ta wpływowa decyzja może wpłynąć na inne spory w sektorze SI.
W zeszłym tygodniu sędzia William Alsup z federalnego sądu w San Francisco wydał długo oczekiwane orzeczenie w sprawie przeciwko Anthropic, kalifornijskiej jednorożcowi odpowiedzialnemu za SI Claude, wniesionej przez trzech autorów: Andreę Bartz, Charlesa Graebera i Kirka Wallace'a Johnsona. To postanowienie, oparte na koncepcji dozwolonego użytku, stanowi punkt zwrotny w debatach na temat wykorzystania chronionych dzieł do szkolenia modeli SI.
W latach 2021-2023 Anthropic pobrał ponad 7 milionów pirackich książek z takich stron jak Books3, LibGen czy PiLiMi. Po uświadomieniu sobie ryzyk prawnych związanych z kopiami pirackimi, od wiosny 2024 firma zaczęła legalnie kupować setki tysięcy z tych książek, skanować je po usunięciu oprawy, nagłówków i stopek, a następnie niszczyć. Zachowała te pliki w swojej wewnętrznej bibliotece, nawet po podjęciu decyzji, że niektóre z nich nie będą używane do szkolenia modeli Claude lub nie będą używane w przyszłości.
Powieści Bartz, eseje Graebera i opowieści Johnsona były zarówno wśród książek pirackich, jak i legalnie zakupionych, często z drugiej ręki. Wnieśli ten pozew zbiorowy przeciwko Anthropic za wykorzystanie ich dzieł bez ich zgody ani rekompensaty finansowej za naruszenie praw autorskich.
Bez rozstrzygania wszystkich kwestii poruszonych w tej sprawie, sędzia Alsup wyjaśnił jednak dwa kluczowe punkty. Z jednej strony uznał, że wykorzystanie przez Anthropic legalnie nabytych książek, zdigitalizowanych i zintegrowanych z bazą szkoleniową, stanowi dozwolony użytek („fair use”) w rozumieniu prawa amerykańskiego. Sędzia porównał ten proces do sposobu, w jaki autor lub badacz opiera się na lekturach, by stworzyć oryginalne dzieło, podkreślając w ten sposób transformacyjny charakter tego użycia. Dla niego proces autorów "nie różni się od tego, gdyby skarżyli się, że szkolenie uczniów w dobrym pisaniu prowadziłoby do eksplozji konkurencyjnych dzieł".
Z drugiej strony, wyraźnie odróżnił to legalne działanie od przechowywania zdigitalizowanych wersji. Według niego, tworzenie wewnętrznej biblioteki z książek skradzionych nie może być usprawiedliwione prawem do innowacji lub badań. Ta część sporu została skierowana do procesu planowanego na grudzień, gdzie odpowiedzialność Anthropic może zostać uznana za charakterystyczne naruszenie praw autorskich.
Firma może wówczas stanąć przed pozwem zbiorowym o większej skali, jeśli sędzia zatwierdzi dołączenie tysięcy autorów do procesu. Jeśli zostanie to potwierdzone, Anthropic może być zobowiązana do wypłaty każdemu z nich do 150 000 $ za dzieło...
To historyczne orzeczenie, jeśli nie zostanie uchylone w ewentualnym odwołaniu, może stać się precedensem i wpłynąć na inne toczące się spory w sektorze SI.
Bardziej zrozumiałe
Czym jest koncepcja 'fair use' w amerykańskim prawie i jak ma się do modeli AI?
'Fair use' to zasada w amerykańskim prawie autorskim pozwalająca na ograniczone wykorzystanie chronionych dzieł, na przykład na potrzeby badawcze lub krytyki, bez zgody. W przypadku AI jest to używane do uzasadniania trenowania modeli z wykorzystaniem zdigitalizowanych dzieł, o ile użycie ma charakter transformacyjny.
Jaka jest różnica między uczciwym korzystaniem z zdigitalizowanych dzieł a tworzeniem biblioteki cyfrowej z pirackimi książkami?
Uczciwe korzystanie pozwala na wykorzystanie zdigitalizowanych dzieł na potrzeby innowacji, pod warunkiem dodania wartości transformacyjnej. Jednak tworzenie biblioteki z pirackich książek pozostaje nielegalne, ponieważ narusza prawa autorskie, mimo intencji badawczych lub innowacyjnych.