Claude під керівництвом: Anthropic визнано винним у зберіганні піратських книг, але виправдано щодо навчання свого ШІ

У короткому : La société Anthropic, qui a utilisé des œuvres protégées pour entraîner son IA Claude, a été jugée par le tribunal de San Francisco sur deux points : l'usage de livres légalement acquis a été considéré comme équitable, mais la conservation de versions numérisées issues de livres piratés pourrait engager sa responsabilité pour atteinte au droit d'auteur. Cette décision influente pourrait impacter d'autres litiges dans le secteur de l'IA.

Минулого тижня суддя Вільям Алсуп федерального суду Сан-Франциско виніс довгоочікуване рішення у справі між трьома авторами: Андреа Бартц, Чарльзом Грейбером і Кірком Воллесом Джонсоном проти Anthropic, каліфорнійської єдинорога, яка створила ШІ Claude. Ця постанова, заснована на принципі добросовісного використання, знаменує поворотний момент у дебатах щодо використання захищених творів для тренування моделей ШІ.

Між 2021 і 2023 роками Anthropic завантажила понад 7 мільйонів піратських книг з сайтів, таких як Books3, LibGen або PiLiMi. Після усвідомлення юридичних ризиків, пов'язаних з піратськими копіями, компанія почала з весни 2024 року легально купувати сотні тисяч цих книг, рвати їх обкладинки, видаляти заголовки та нижні колонтитули, а потім знищувати. Вона зберегла ці файли у своїй внутрішній бібліотеці навіть після рішення, що деякі з них не будуть використовуватися для навчання своїх моделей Claude або не використовуватимуться в майбутньому.

Романи Бартц, есеї Грейбера та розповіді Джонсона входять до числа як піратських, так і легально придбаних книг, часто вживаних. Вони подали цей колективний позов проти Anthropic, який використовував їхні твори без їхньої згоди або фінансової компенсації за порушення авторських прав.

Без вирішення всіх питань, піднятих у цій справі, суддя Алсуп все ж уточнив два важливі моменти. З одного боку, він вважає, що використання Anthropic легально придбаних книг, оцифрованих і інтегрованих у свою базу для навчання, є добросовісним використанням ("fair use") у сенсі американського законодавства. Суддя порівняв цей процес з тим, як автор або дослідник опирається на читання для створення оригінальної роботи, підкреслюючи трансформаційну природу використання. Для нього позов авторів "не відрізняється від того, якби вони скаржилися, що навчання школярів добре писати призведе до вибуху конкурентних творів".

З іншого боку, він чітко розрізнив цей законний підхід від зберігання оцифрованих версій. На його думку, створення внутрішньої бібліотеки з вкрадених книг не може бути виправдане правом на інновації або дослідження. Ця частина спору передається на судовий розгляд, запланований на грудень, де відповідальність Anthropic може бути притягнута за очевидне порушення авторських прав.

Компанія може тоді зіткнутися з колективним позовом іншого масштабу, якщо суддя затвердить включення тисяч авторів до справи. Якщо це підтвердиться, Anthropic може бути зобов'язана виплатити кожному до 150 000 $ за твір...

Це історичне рішення, якщо воно не буде скасоване в можливій апеляції, може стати прецедентом і вплинути на інші поточні суперечки у сфері ШІ.

Перекладено з Claude à la barre : Anthropic reconnue coupable d’avoir conservé des livres piratés, mais blanchie sur l’entraînement de son IA

Краще зрозуміти

Що таке концепція 'fair use' у американському законодавстві і як вона застосовується до моделей ШІ?

'Fair use' — це принцип в американському законодавстві про авторське право, який дозволяє обмежене використання захищених авторським правом творів, як-от для досліджень або критики, без дозволу. У ШІ він використовується для виправдання навчання моделей з використанням оцифрованих творів, за умови, що використання є трансформаційним.

У чому різниця між добросовісним використанням оцифрованих творів і створенням цифрової бібліотеки з піратськими книгами?

Добросовісне використання дозволяє використовувати оцифровані твори для інновацій, за умови, що додається трансформаційна цінність. Однак створення бібліотеки з піратських книг залишається незаконним, оскільки це порушує закони про авторське право, незважаючи на наміри для досліджень чи інновацій.