Chicken Soup for the Soul poursuit des sociétés d’IA pour violation du droit d’auteur

Chicken Soup for the Soul poursuit les sociétés technologiques OpenAI, Anthropic, Google, Meta, xAI, Perplexity, Apple et Nvidia pour violation du droit d’auteur. La plainte, déposée le 17 mars dans le district nord de Californie, allègue que des centaines de ses œuvres protégées par le droit d’auteur ont été ingérées sans autorisation ni compensation pour former de grands modèles linguistiques.

Dans une affirmation remarquable, le procès allègue qu’en 2018, un employé d’OpenAI a téléchargé des livres piratés de Library Genesis – une bibliothèque fantôme à plusieurs reprises ordonnée par les tribunaux fédéraux – pour créer des ensembles de données internes utilisés plus tard pour entraîner GPT-3. Selon le dossier, cette décision a donné l’exemple à tous les autres accusés.

Quelques semaines après la sortie de GPT-3, le collectif open source EleutherAI a rassemblé « Books3 », environ 200 000 livres copiés à partir de Bibliotik, un tracker BitTorrent privé, et les a regroupés dans un ensemble de données distribué publiquement appelé The Pile. Les autres accusés, selon la plainte, ont ensuite adopté The Pile comme ressource de formation fondamentale, certains l’étendant à des bibliothèques fantômes supplémentaires.

« Chaque escalade a aggravé la précédente : d’un simple téléchargement de LibGen à un ensemble de données piratées aux normes de l’industrie, en passant par la récolte en masse de toutes les principales bibliothèques fantômes sur Internet », indique le dossier.

Le plaignant qualifie ce comportement de « non pas d’actes de contrefaçon isolés, mais d’un comportement à l’échelle de l’industrie ». La violation, ajoute la plainte, ne s’est pas arrêtée aux téléchargements initiaux : les accusés ont reproduit des œuvres protégées par le droit d’auteur « potentiellement d’innombrables » fois supplémentaires grâce au prétraitement, à la déduplication et à l’ajustement itératif du modèle.

La plainte fait également valoir que la série Chicken Soup for the Soul a été intentionnellement ciblée pour ses « récits à la première personne étroitement édités, écrits dans un langage naturel et conversationnel qui transmettent des émotions, une réflexion morale et une narration cohérente sous une forme concise » – des caractéristiques qui ont rendu la franchise, dans le cadre des plaignants, « particulièrement bien adaptée à la formation de grands modèles de langage pour reproduire la voix humaine authentique, le rythme narratif, le ton émotionnel et la structure de l’histoire ».

Tout comme la plainte déposée en décembre par l’auteur John Carreyrou et d’autres contre plusieurs des mêmes accusés, cette plainte vise également à remettre en question le modèle de recours collectif qui a dominé les litiges relatifs aux droits d’auteur sur l’IA.

Faisant référence au règlement Anthropic en cours dans le district nord de Californie, la poursuite indique que le cadre paierait aux titulaires de droits environ 3 000 dollars par œuvre, soit « seulement 2 % du plafond statutaire de la loi sur le droit d’auteur de 150 000 dollars par œuvre volontairement violée ». La plainte indique que de tels règlements « semblent servir les défendeurs et non les créateurs ».

Chicken Soup for the Soul demande plutôt des dommages-intérêts légaux individualisés déterminés par un jury. Les cabinets d’avocats à l’origine de cette action affirment que plus de 1 000 auteurs représentant plus de 5 000 œuvres ont adhéré à la même approche.