Veritone lance une nouvelle plate-forme pour permettre aux célébrités et aux influenceurs de cloner leur voix avec l’IA


L’enregistrement de publicités et de recommandations de produits peut être un travail lucratif pour les célébrités et les influenceurs. Mais est-ce trop comme un travail acharné? C’est ce que parie la firme américaine Veritone. Aujourd’hui, la société lance une nouvelle plate-forme appelée Marvel.AI qui permettra aux créateurs, aux personnalités des médias et à d’autres de générer de faux clones de leur voix pour obtenir une licence à leur guise.

« Les gens veulent conclure ces accords, mais ils n’ont pas assez de temps pour entrer dans un studio et produire le contenu », a déclaré le président de Veritone, Ryan Steelberg. Le bord. «Les influenceurs numériques, les athlètes, les célébrités et les acteurs: c’est un atout énorme qui fait partie de leur marque.»

Avec Marvel.AI, dit-il, n’importe qui peut créer une copie réaliste de sa voix et la déployer comme bon lui semble. Pendant que la célébrité Y dort, leur voix peut être en train de se déplacer, enregistrant des spots radio, lisant des livres audio et bien plus encore. Steelberg dit que la plate-forme sera même en mesure de ressusciter la voix des morts, en utilisant des enregistrements d’archives pour former des modèles d’IA.

«Quiconque détient le droit d’auteur sur ces voix, nous travaillerons avec eux pour les amener sur le marché», dit-il. «Cela dépendra du titulaire des droits et de ce qu’il jugera approprié, mais hypothétiquement, oui, vous pourriez demander à Walter Cronkite de relire les nouvelles du soir.»

La synthèse vocale s’est rapidement améliorée ces dernières années, avec des techniques d’apprentissage automatique permettant de créer des voix toujours plus réalistes. (Pensez simplement à la différence entre la façon dont Siri d’Apple sonnait lors de son lancement en 2011 et comment cela sonne maintenant.) De nombreuses grandes entreprises technologiques comme Amazon proposent des modèles de synthèse vocale prêts à l’emploi qui génèrent des voix à grande échelle qui sont robotiques mais pas désagréable. Mais de nouvelles entreprises fabriquent également des clones de voix de boutique qui ressemblent à des individus spécifiques, et les résultats peuvent être presque indiscernables de la réalité. Écoutez simplement ce clone de voix du podcasteur Joe Rogan, par exemple.

C’est ce bond en avant de la qualité qui a motivé Veritone à créer Marvel.AI, dit Steelberg, ainsi que le potentiel de la parole synthétique pour s’harmoniser avec les activités existantes de l’entreprise.

Bien que Veritone se vende comme une «entreprise d’IA», une grande partie de ses revenus provient apparemment de la publicité à l’ancienne et des licences de contenu. Comme l’explique Steelberg, sa filiale publicitaire Veritone One est fortement investie dans l’espace podcast, et place chaque mois plus de 75 000 «intégrations publicitaires» avec des influenceurs. «Ce sont principalement des intégrations natives, comme les placements de produits», dit-il. «Cela permet aux talents de faire entendre des commandites et des publicités. C’est extrêmement efficace mais très coûteux et prend du temps. »

Une autre partie de l’entreprise, Veritone Licensing, octroie des licences vidéo à partir d’un certain nombre d’archives importantes. Il s’agit notamment des archives appartenant à des diffuseurs comme CBS et CNN et à des organisations sportives comme la NCAA et l’US Open. «Lorsque vous voyez les images d’atterrissage sur la lune d’Apollo apparaître dans les films, ou le contenu des mots Tiger dans une publicité Nike, tout ce qui passe par Veritone», déclare Steelberg. C’est cette expérience avec les licences et la publicité qui donnera à Veritone un avantage sur les startups d’IA se concentrant uniquement sur la technologie, dit-il.

Aux clients, Marvel.AI proposera deux flux. L’un sera un modèle en libre-service, où tout le monde peut choisir dans un catalogue de voix pré-générées et créer de la parole à la demande. (C’est ainsi qu’Amazon, Microsoft et al. Le font depuis des années.) Mais l’autre volet – «l’objectif», dit Steelberg – sera une «approche gérée en gants blancs», dans laquelle les clients soumettent des données de formation, et Veritone créera un clone de voix juste pour eux. Les modèles résultants seront stockés sur les systèmes de Veritone et disponibles pour générer de l’audio au fur et à mesure que le client le souhaite. Marvel.AI fonctionnera également comme une place de marché, permettant aux acheteurs potentiels de soumettre des demandes pour utiliser ces voix. (Le prix de tout cela n’est pas encore clair.)

Steelberg est convaincu que la demande pour ces voix existe et que le modèle commercial de Veritone est prêt à fonctionner. Mais un facteur majeur décidera du succès de Marvel.AI: la qualité des voix d’IA que la plate-forme peut générer. Et c’est beaucoup moins sûr.

Lorsqu’on lui a demandé des exemples du travail de l’entreprise, Veritone a partagé trois courts clips avec Le bord, chacun une seule ligne d’approbation pour une marque de bonbons à la menthe. La première ligne est lue par Steelberg lui-même, la seconde par son clone d’IA et la troisième par une voix permutée entre les sexes. Vous pouvez écouter les trois ci-dessous:

Le clone AI est, à mon oreille du moins, une assez bonne imitation, mais pas une copie parfaite. C’est plus plat et plus découpé que la vraie chose. Mais ce n’est pas non plus une démonstration complète de ce que les voix peuvent faire lors d’une approbation. La livraison de Steelberg n’a pas l’enthousiasme et la verve que vous attendez d’une vraie publicité (nous ne le lui reprochons pas – il est un dirigeant et non un doubleur), et il n’est donc pas clair si les modèles vocaux de Veritone peuvent capturer une gamme complète d’émotions. .

Ce n’est pas non plus un bon signe que la voix off de la bobine de grésillement de la plate-forme (intégrée en haut de l’histoire) ait été réalisée par Steelberg lui-même plutôt que par une copie de l’IA. Soit l’entreprise ne pensait pas qu’un clone de voix était assez bon pour le travail, soit elle manquait de temps pour en générer un – de toute façon, ce n’est pas une grande approbation du produit.

La technologie évolue rapidement, cependant, et Steelberg tient à souligner que Veritone dispose des ressources et de l’expertise nécessaires pour adopter les nouveaux modèles d’apprentissage automatique qui émergeront dans les années à venir. Là où cela va se différencier, dit-il, c’est de gérer l’expérience des clients et des clients pour déployer réellement la parole synthétique à grande échelle.

L’un des problèmes qu’offre Steelberg est de savoir comment le discours synthétique pourrait diluer le pouvoir des avenants. Après tout, l’attrait de l’endossement du produit repose sur la croyance (même illusoire) que telle ou telle célébrité apprécie vraiment cette marque particulière de céréales / dentifrices / d’assurance-vie. Si la célébrité ne peut pas être dérangée d’exprimer son approbation elle-même, cela n’enlève-t-il pas le pouvoir de vente de l’annonce?

La solution de Steelberg est de créer une norme de l’industrie pour la divulgation – une sorte de ton audible qui joue avant la parole synthétique pour a) faire savoir aux auditeurs que ce n’est pas une vraie voix, et b) les rassurer que le propriétaire de la voix approuve cette utilisation. «Il ne s’agit pas seulement d’éviter les connotations négatives de tromper le consommateur, mais aussi de vouloir qu’il soit confiant que [this or that celebrity] a vraiment approuvé ce contenu synthétique », dit-il.

Ce sont des questions comme celles-ci qui vont devenir de plus en plus importantes à mesure que le contenu synthétique devient plus courant, et il est clair que Veritone a beaucoup réfléchi à ces problèmes. Maintenant, l’entreprise a juste besoin de convaincre les influenceurs, les athlètes, les acteurs, les podcasteurs et les célébrités du monde entier de lui prêter leur voix.

Laisser un commentaire