PW Studio: Spotlight on Elevenlabs

Des livres audio et des podcasts aux articles de presse narrés, le contenu audio est devenu incontournable. En 2024, 38% des Américains ont écouté un livre audio, selon la Audio Publishers Association. Mais une pièce audio n’est aussi convaincante que la voix la lisant. C’est là que Elevenlabs entre en jeu.

Avec des bureaux à Londres, New York et Varsovie, ElevenLabs est une société audio d’IA avec une mission pour rendre le contenu universellement accessible. L’équipe de chercheurs et de spécialistes de produits de l’entreprise développe des modèles audio d’IA capables de générer étrangement un discours réaliste en 32 langues, voix et effets sonores.

La plupart d’entre nous se sont sentis déçues par le contenu audio livré par l’IA qui semble terne, artificiel ou rythmiquement. Le problème, selon l’équipe de recherche d’ElevenLabs, est que les produits traditionnels de texte à dispection divisent les syllabes en sons, qui peuvent être robotiques. ElevenLabs adopte une approche différente. Son modèle ramasse les indices émotionnels et le contexte culturel dans le texte et adapte sa livraison de manière appropriée.

«Notre technologie fonctionne différemment en comprenant à la fois ce que la phrase dit et comment elle devrait sembler», disent Jack McDermott, qui mène la croissance des Elevenlabs pour leur application audio audio. « Cela permet à nos voix d’IA d’atteindre une plage émotionnelle élevée et d’éviter de faire des erreurs logiques lorsque votre contenu est lu à haute voix. »

Essentiellement, l’équipe derrière ElevenLabs a insisté pour amener de vraies voix humaines dans le développement de la plate-forme. La société s’est associée à des acteurs de voix, dont Bob Carter, célèbre pour ses rôles dans des jeux vidéo comme Mortal Kombat. Carter fait partie des milliers d’acteurs de voix qui contribuent et gagnent des revenus de la bibliothèque vocale d’ElevenLabs, qui a versé plus d’un million de dollars aux contributeurs au cours de sa première année.

«Nous avons toujours considéré la narration vocale de l’IA comme une partie d’un écosystème qui comprend des narrateurs et des créateurs de voix», explique McDermott. «C’est pourquoi nous avons défendu une approche responsable de l’utilisation et de la sauvegarde des voix de l’IA, de la construction de notre plate-forme en partenariat avec les acteurs de la voix.»

La gamme émotionnelle intégrée à la plate-forme de publication d’ElevenLabs donne un avantage pour réserver des éditeurs souhaitant transformer leurs mots écrits en audio riche et immersif. La plate-forme simplifie la production audio pour les petits éditeurs indépendants, y compris les nouveaux éditeurs de livres audio. Les plus grands éditeurs ou ceux qui recherchent un public plus large pour leurs livres audio peuvent utiliser la plate-forme pour se développer à l’international dans des dizaines de langues. À l’avenir, ElevenLabs espère rendre un excellent contenu audio disponible dans n’importe quelle langue dans le monde.

Les outils d’IA de l’entreprise sont également destinés aux particuliers. Les écrivains et éditeurs, par exemple, peuvent faire lire leur travail écrit par l’IA qui ressemble à une personne réelle. Les auteurs indépendants peuvent utiliser l’application ElevenReader pour partager leurs livres audio directement avec le public. Bientôt, le nouveau programme de publication ElevenReader permettra aux auteurs et aux éditeurs de vendre des livres audio directement via l’application ElevenReader.

La plate-forme transforme également le contenu audio au-delà des domaines de la publication de livres et des médias d’information. Les développeurs de jeux utilisent Elevenlabs IA pour animer les personnages, par exemple, tandis que les studios de divertissement peuvent adapter le contenu pour le public dans différents pays et régions. Et, pour les personnes qui ont perdu leur voix, les outils ElevenLabs peuvent permettre la communication et aider à répondre à d’autres besoins d’accessibilité.

Dans ses nombreuses applications, la plate-forme ElevenLabs AI est également conçue pour assurer la sécurité et la transparence.

Pour les acteurs qui contribuent à la bibliothèque vocale et aux auteurs qui partagent leur travail via l’application, ElevenLabs peut être un partenaire de confiance. Les auditeurs peuvent se réconforter en sachant que les créateurs derrière l’œuvre sont compensés.

«Nous développons nos outils soucieux de leur impact», explique McDermott. «Les voix d’IA offrent un aperçu de l’avenir de l’interaction numérique, et les rendre sûrs est notre priorité. Notre objectif est de nous assurer que nos produits sont développés, déployés et utilisés en toute sécurité tout en continuant à générer des applications positives et créatives.»

Renseignez-vous sur Elevenlabs à ElevenLabs.io.

Une version de cet article est apparue dans le numéro 06/02/2025 de Publishers Weekly Sous le titre: projecteur sur onzelabs