Czy trenowanie AI na książkach to dozwolony użytek?

W USA zapadł pierwszy wyrok dotyczący wykorzystywania książek do trenowania sztucznej inteligencji. Sąd federalny w San Francisco uznał, że działania firmy Anthropic, która szkoliła model Claude na milionach książek, mieszczą się w granicach tzw. dozwolonego użytku („fair use”).

Sędzia William Alsup stwierdził, że przetwarzanie książek miało charakter „transformacyjny” i nie narusza rynkowej wartości oryginalnych dzieł.

Dlaczego to „fair use”?

Sędzia podkreślił, że trenowanie AI nie polega na kopiowaniu książek, lecz na analizie treści w celu stworzenia nowych funkcjonalności. To, zdaniem sądu, przypomina inne przypadki już uznane za dozwolony użytek – takie jak indeksowanie treści przez wyszukiwarki internetowe.

Dodatkowo model Claude nie generuje pełnych wersji książek ani nie udostępnia ich treści w sposób, który mógłby zastąpić oryginał. Takie użycie danych nie szkodzi więc twórcom pod względem sprzedaży czy wartości rynkowej dzieła.

W tle: kontrowersje wokół pirackich książek

Część pozwu dotyczyła faktu, że Anthropic wcześniej ściągnął z internetu około 7 milionów książek z nielegalnych źródeł. Firma twierdzi, że ostatecznie nie użyła ich do trenowania modelu, a zamiast tego zakupiła „miliony” legalnych egzemplarzy.

Sędzia uznał jednak, że samo pobranie i przechowywanie pirackich kopii narusza prawo autorskie i może skutkować odpowiedzialnością finansową. Sprawa ma wrócić na wokandę w grudniu.

Co to oznacza dla rynku AI i wydawców?

Wyrok ten może być korzystny dla twórców systemów AI, ale jednocześnie pokazuje, że granica między legalnym a bezprawnym wykorzystaniem danych jest cienka. Kluczowe wnioski:

„Fair use” może obejmować trenowanie modeli, ale tylko na legalnie pozyskanych materiałach.
Przetwarzanie treści musi być transformacyjne – nie może prowadzić do powielania dzieł.
Firmy AI muszą szczególnie uważać na źródła danych – pirackie treści niosą wysokie ryzyko prawne.

Pisaliśmy już o tej sprawie wcześniej

W tamtych tekstach analizowaliśmy zarzuty twórców wobec firm takich jak Meta i Anthropic oraz pytania o to, czy trenowanie modeli na cudzych dziełach bez zgody to przyszłość, czy naruszenie prawa.

To dopiero pierwszy z wielu wyroków, które zadecydują o relacjach między sztuczną inteligencją a prawem autorskim. Stawka jest wysoka – zarówno dla twórców, jak i dla całej branży technologicznej.

Żródła:

894