
Les États-Unis ont rendu leur premier jugement sur l’utilisation de livres pour entraîner une IA. Un tribunal fédéral de San Francisco a estimé que les actions d’Anthropic – qui a utilisé des millions de livres pour entraîner son modèle Claude – relèvent de ce que l’on appelle le « fair use ».
Le juge William Alsup a estimé que l’utilisation des livres était de nature « transformatrice » et ne portait pas atteinte à la valeur commerciale des œuvres originales.
Pourquoi s’agit-il de fair use ?
Le juge a souligné que former une IA ne signifie pas copier les livres, mais analyser leur contenu pour créer de nouvelles fonctionnalités. Ce processus est, selon le tribunal, comparable à d’autres cas déjà reconnus comme relevant du fair use, tels que l’indexation de contenu par les moteurs de recherche.
De plus, le modèle Claude ne reproduit pas l’intégralité des livres et ne les présente pas d’une manière qui pourrait les remplacer. Ce type d’utilisation ne nuit donc pas aux auteurs sur le plan des ventes ou de la valeur commerciale.
En coulisses : la controverse des livres piratés
Une partie de la plainte portait sur le fait qu’Anthropic avait précédemment téléchargé environ sept millions de livres depuis des sources illégales. L’entreprise affirme ne pas avoir utilisé ces contenus et avoir acheté à la place des « millions » d’exemplaires légitimes.
Cependant, le juge a statué que le simple fait de télécharger et de stocker des copies piratées constitue une infraction au droit d’auteur, susceptible d’engendrer des sanctions financières. Cette partie de l’affaire sera réexaminée en décembre.
Quelles conséquences pour l’IA et l’édition ?
Si ce jugement semble favorable aux développeurs d’IA, il montre aussi à quel point la frontière entre usage légal et illégal des données est mince. À retenir :
- Le fair use peut s’appliquer à l’entraînement des modèles, mais seulement avec des sources légalement acquises.
- L’utilisation doit être transformatrice – elle ne peut aboutir à une simple reproduction des œuvres.
- Les entreprises d’IA doivent rigoureusement vérifier la provenance de leurs données, car les contenus piratés comportent de sérieux risques juridiques.
Nous en avons déjà parlé
- Meta accusée ? Protégez vos œuvres dès maintenant
- L’IA entraînée avec des livres piratés. Les auteurs ripostent
Dans ces articles, nous avons examiné les accusations portées par des auteurs contre Meta et Anthropic, ainsi que le débat plus large sur l’utilisation d’œuvres protégées sans autorisation pour former des modèles d’IA.
Ce n’est que le premier d’une série de jugements qui définiront la relation entre intelligence artificielle et droit d’auteur. L’enjeu est majeur – pour les auteurs, les éditeurs et l’ensemble de l’industrie technologique.
Sources :