Les faux livres sont un vrai problème, mais une solution est peut-être proche

Un de mes amis éditeurs m'a récemment parlé d'un rapport de ventes qu'ils avaient reçu d'un grand détaillant dans lequel certains de leurs livres n'avaient enregistré aucune vente. Il s’est toutefois avéré que les ventes avaient été nombreuses : elles ont toutes été destinées à des contrefacteurs. Si vous pensez qu'il s'agit d'une valeur aberrante, ce n'est pas le cas. La contrefaçon est un problème grave et non négligeable auquel est confrontée l'industrie.

Il y a contrefaçon lorsqu'une partie se fait passer pour le véritable éditeur d'un livre pour vendre de fausses versions de livres. Parfois, un mauvais acteur peut se faire passer pour un éditeur légitime dans le cadre d’une escroquerie, acceptant les commandes et les paiements mais ne livrant jamais la marchandise. Mais de nos jours, les contrefacteurs livrent de plus en plus souvent de fausses versions de livres.

Parfois, ces versions sont manifestement fausses : les mauvais scans d’un livre ne sont pas rares. Parfois, les contrefaçons sont de véritables EPUB que le contrefacteur a dupliqués et sont donc difficiles à différencier des vrais. Et comme elles sont généralement moins chères, les éditions contrefaites apparaissent souvent en bonne place dans les moteurs de recommandation en ligne.

Comme l’explique un responsable d’un des Big Five : « Presque tout le matériel contrefait est modifié d’une manière ou d’une autre. Souvent, quelqu'un acquiert un contenu authentique, tel que des EPUB, puis supprime les métadonnées du fichier, modifie le fichier et republie le fichier sous forme de livre électronique sous un nom d'auteur, un titre et un éditeur différents mais similaires, en utilisant une couverture et un éditeur suffisamment proches. des supports marketing pour attirer beaucoup de regards et lier souvent la fausse édition aux vraies éditions dans les magasins en ligne.

Ces dernières années, le groupe de travail anti-contrefaçon du groupe communautaire W3C a exploré des solutions potentielles au problème. Une voie de recours prometteuse est une norme que j'ai déjà mentionnée dans cet article : C2PA, une norme de métadonnées développée par la Coalition pour la provenance et l'authenticité du contenu. C2PA est une spécification de métadonnées qui permet aux créateurs de contenu (pas seulement du texte mais également d'autres fichiers, y compris des images et de l'audio) de « signer » numériquement leur contenu pour établir son authenticité. Plus tôt ce mois-ci, C2PA a été adopté par OpenAI, Meta et Google, ce qui indique clairement que la norme est prise très au sérieux.

Mais C2PA présente une grande vulnérabilité : il peut être supprimé d’un fichier. Heureusement, une solution semble être en préparation, qui consiste à associer C2PA à une nouvelle norme, connue sous le nom d'ISCC, l'International Standard Content Code.

Sebastian Posth, directeur général de Liccium à Leiden et membre du groupe de travail anti-contrefaçon du W3C, a joué un rôle moteur dans le développement de l'ISCC. Il décrit ISCC comme un « hachage dérivé du contenu avec des capacités de correspondance quasi-dupliquées ».

« 

Parfois, les contrefaçons sont de véritables EPUB, que le contrefacteur a dupliqués, et sont donc difficiles à différencier des vrais.

»

Par hacher, Posth désigne une chaîne complexe dérivée des données qui composent un actif numérique : les bits et octets réels. Si cet actif est modifié de quelque manière que ce soit (par des modifications de son contenu, de ses métadonnées, voire des changements subtils dans les couleurs de l'image de couverture d'un livre), un ISCC dérivé de cet actif modifié ne correspondra pas exactement à l'ISCC de l'objet réel. Et comme les ISCC peuvent révéler des « quasi-doublons », la suppression des métadonnées d’un véritable livre numérique ne permettrait plus de dissimuler des copies contrefaites. Un éditeur pourra enregistrer le véritable ISCC, et si un nouvel ISCC dérivé d'un fichier prétendant être authentique ne correspond pas suffisamment mais se situe dans une certaine plage, il s'agit probablement d'une contrefaçon proche de l'original et mérite un examen plus approfondi. enquête.

« La beauté de l'ISCC est qu'il peut identifier une couverture ou un autre aspect du livre qui est proche, mais pas identique, de l'original, comme étant un problème potentiel », a déclaré Liisa McCloy-Kelley, présidente de l'Anti-Counterfeiting. Groupe de travail, explique. « Ainsi, lorsque les contrefacteurs pensent qu’une couleur différente ou la modification du nom de l’auteur va contrecarrer les outils qui trouvent des correspondances, l’ISCC peut être utilisé comme un outil pour dénoncer ces contrefaçons potentielles. Et cela fonctionne avec n’importe quel type de fichier. Vous pouvez l’utiliser pour les couvertures, pour les EPUB, les images, les PDF et même les fichiers audio.

Pour les éditeurs, il s’agit d’une évolution importante et à surveiller. La combinaison des informations détaillées sur la provenance fournies par le C2PA avec la capacité de l'ISCC à détecter les actifs modifiés (et en même temps à identifier l'original modifié) pourrait enfin fournir aux éditeurs les outils dont ils ont besoin pour lutter efficacement contre le problème croissant de la contrefaçon.

Bill Kasdorf est directeur chez Kasdorf & Associates et associé fondateur de Publishing Technology Partners.

Une version de cet article est parue dans le numéro du 26/02/2024 de Éditeurs hebdomadaire sous le titre : Lutte contre la contrefaçon