La « technologie de narration numérique » pour fournir de l’audio à des millions de livres


Apple a discrètement lancé aujourd’hui une technologie de narration numérique qui utilise l’intelligence artificielle pour générer une narration à consonance humaine pour les livres. Bien que cela semble être une idée dangereusement mauvaise au début – comment l’IA saura-t-elle quoi souligner, où s’exciter et où ralentir – les petits échantillons qu’Apple a partagés sonnent étonnamment humains.

La cible initiale : des livres à longue traîne pour lesquels il ne vaudra jamais la peine de payer un narrateur humain.

« De plus en plus d’amateurs de livres écoutent des livres audio, mais seule une fraction des livres est convertie en audio, laissant des millions de titres inédits », déclare Apple. « De nombreux auteurs – en particulier les auteurs indépendants et ceux associés à de petits éditeurs – ne sont pas en mesure de créer des livres audio en raison du coût et de la complexité de la production. »

Apple sort quatre voix pour commencer, deux femmes et deux hommes. Les voix sont optimisées pour des genres de livres spécifiques, donc Jackson est destiné à la fiction ou à la romance avec une voix profonde et quelque peu rauque, tandis qu’Helen est une soprano conçue pour la non-fiction et le développement personnel.

« Mitchell » et « Madison » complètent les quatre premières voix d’Apple.

C’est encore un autre exemple d’IA générative, qui explose aujourd’hui grâce au ChatGPT d’OpenAI et à de nombreux autres startups et projets, dont Dall-E, Midjourney et d’autres. ChatGPT est déjà interdit dans les écoles de New York en raison de problèmes de tricherie, mais l’industrie dans son ensemble devrait passer de presque rien à plus de 110 milliards de dollars de revenus d’ici 2030.

En cause, bien sûr, les emplois humains dans l’art et le design, le droit d’auteur sur les images et les peintures de formation, et maintenant, avec les narrateurs IA, les emplois humains dans la création de livres audio.

Mais il y a aussi des emplois créés par l’IA.

« La narration numérique Apple Books associe une technologie de synthèse vocale avancée à un travail important d’équipes de linguistes, de spécialistes du contrôle qualité et d’ingénieurs du son pour produire des livres audio de haute qualité à partir d’un fichier ebook », déclare Apple. « Apple est depuis longtemps à l’avant-garde de la technologie vocale innovante et l’a maintenant adaptée à la lecture longue durée, en collaboration avec des éditeurs, des auteurs et des narrateurs. »

Les quatre voix initiales d’Apple sont en quelque sorte des voix américaines non accentuées par défaut, avec une intonation légèrement différenciée qui suggèrent de petites variations dans l’origine ethnique. Bien qu’Apple n’ait rien dit sur les futures voix, il est probable que la société étendra le programme si elle réussit à inclure d’autres accents nationaux tels que l’anglais ou l’australien, et peut-être des voix régionales ou ethniques telles que le sud américain ou les ebonics, ou même des voix traditionnelles. Accents de Boston ou de New York.

Bien sûr, l’anglais n’est qu’un début : l’espagnol, le français, l’allemand et d’autres langues attendent des capacités similaires.

Apple ne se contentera pas d’appliquer les voix de l’IA à chaque titre de sa bibliothèque. Il y a en fait un long processus à engager, en commençant par s’inscrire avec un partenaire privilégié qui gérera le processus, en choisissant votre titre, en sélectionnant une voix, en choisissant la pochette, puis en attendant un à deux mois pour traiter le livre et effectuer des contrôles de qualité. .

La publication n’est pas garantie, dit Apple : le livre narré doit répondre aux normes de qualité et de contenu d’Apple.

Selon les reportages de The Guardian à ce sujet, Apple couvrira cependant les coûts.

Il y a quelques mois à peine, Spotify, qui a une activité importante dans les livres audio et les podcasts en plus de ses offres musicales principales, s’est plaint qu’Apple se livrait à un « comportement anticoncurrentiel » concernant les achats de livres audio sur l’application Spotify sur iPhone. Spotify surveillera ces développements de près, tout comme Audible, le titan du marché des livres audio appartenant à Amazon.

Les premiers retours semblent bons, mais il est important de se rappeler qu’Apple ne partage que de petits extraits. Il sera important de voir comment des livres entiers se révéleront.

Laisser un commentaire