
W USA zapadł pierwszy wyrok dotyczący wykorzystywania książek do trenowania sztucznej inteligencji. Sąd federalny w San Francisco uznał, że działania firmy Anthropic, która szkoliła model Claude na milionach książek, mieszczą się w granicach tzw. dozwolonego użytku („fair use”).
Sędzia William Alsup stwierdził, że przetwarzanie książek miało charakter „transformacyjny” i nie narusza rynkowej wartości oryginalnych dzieł.
Dlaczego to „fair use”?
Sędzia podkreślił, że trenowanie AI nie polega na kopiowaniu książek, lecz na analizie treści w celu stworzenia nowych funkcjonalności. To, zdaniem sądu, przypomina inne przypadki już uznane za dozwolony użytek – takie jak indeksowanie treści przez wyszukiwarki internetowe.
Dodatkowo model Claude nie generuje pełnych wersji książek ani nie udostępnia ich treści w sposób, który mógłby zastąpić oryginał. Takie użycie danych nie szkodzi więc twórcom pod względem sprzedaży czy wartości rynkowej dzieła.
W tle: kontrowersje wokół pirackich książek
Część pozwu dotyczyła faktu, że Anthropic wcześniej ściągnął z internetu około 7 milionów książek z nielegalnych źródeł. Firma twierdzi, że ostatecznie nie użyła ich do trenowania modelu, a zamiast tego zakupiła „miliony” legalnych egzemplarzy.
Sędzia uznał jednak, że samo pobranie i przechowywanie pirackich kopii narusza prawo autorskie i może skutkować odpowiedzialnością finansową. Sprawa ma wrócić na wokandę w grudniu.
Co to oznacza dla rynku AI i wydawców?
Wyrok ten może być korzystny dla twórców systemów AI, ale jednocześnie pokazuje, że granica między legalnym a bezprawnym wykorzystaniem danych jest cienka. Kluczowe wnioski:
- „Fair use” może obejmować trenowanie modeli, ale tylko na legalnie pozyskanych materiałach.
- Przetwarzanie treści musi być transformacyjne – nie może prowadzić do powielania dzieł.
- Firmy AI muszą szczególnie uważać na źródła danych – pirackie treści niosą wysokie ryzyko prawne.
Pisaliśmy już o tej sprawie wcześniej
W tamtych tekstach analizowaliśmy zarzuty twórców wobec firm takich jak Meta i Anthropic oraz pytania o to, czy trenowanie modeli na cudzych dziełach bez zgody to przyszłość, czy naruszenie prawa.
To dopiero pierwszy z wielu wyroków, które zadecydują o relacjach między sztuczną inteligencją a prawem autorskim. Stawka jest wysoka – zarówno dla twórców, jak i dla całej branży technologicznej.
Żródła: