OpenAI dévoile Voice Engine, une technologie d'IA qui reproduit les voix humaines


Initialement, OpenAI a introduit un outil permettant aux individus de créer des images numériques en décrivant simplement les visualisations souhaitées. Par la suite, ils ont développé une technologie similaire capable de générer des vidéos animées rappelant les productions hollywoodiennes. Aujourd’hui, ils ont dévoilé une technologie capable de reproduire la voix de quelqu’un. La célèbre startup d'intelligence artificielle a annoncé vendredi qu'un groupe sélectionné d'entreprises testait un nouveau système OpenAI appelé Voice Engine, conçu pour reproduire la voix d'une personne à partir d'un enregistrement de 15 secondes.

En téléchargeant un enregistrement de soi accompagné d'un paragraphe de texte, le système peut articuler le texte à l'aide d'une voix synthétique qui ressemble beaucoup à celle de l'utilisateur. Notamment, le texte ne doit pas nécessairement être dans la langue maternelle de l’utilisateur. Par exemple, un anglophone peut voir sa voix reproduite en espagnol, français, chinois ou dans diverses autres langues.

Quel danger le moteur vocal pose-t-il

OpenAI est prudent quant à la large diffusion de cette technologie en raison de ses efforts continus pour comprendre ses risques potentiels. À l’instar des générateurs d’images et de vidéos, un générateur de voix pourrait potentiellement contribuer à la propagation de fausses informations sur les plateformes de médias sociaux. De plus, cela pourrait permettre aux criminels d’usurper l’identité d’individus en ligne ou lors de conversations téléphoniques.

La société a exprimé une inquiétude particulière quant à la possibilité que cette technologie soit utilisée pour contourner les authentificateurs vocaux qui protègent l'accès aux comptes bancaires en ligne et à d'autres applications personnelles.

Jeff Harris, chef de produit chez OpenAI, a déclaré dans une interview : « C'est une question sensible, et il est important de bien faire les choses », comme le rapporte le New York Times.

La société étudie des méthodes permettant d'ajouter des filigranes aux voix synthétiques ou de mettre en œuvre des contrôles pour empêcher les individus d'utiliser la technologie avec les voix de politiciens ou d'autres personnalités.

OpenAI fait partie des nombreuses entreprises qui ont développé une technologie d'IA avancée capable de générer rapidement des voix synthétiques. Ces entreprises comprennent des géants de la technologie comme Google et des startups comme ElevenLabs basées à New York.

Depuis l'année dernière, OpenAI a utilisé sa technologie pour activer une version de ChatGPT capable de parler. De plus, il fournit depuis longtemps aux entreprises diverses voix pour des applications similaires, toutes créées à partir d'enregistrements fournis par des acteurs vocaux.

Cependant, la société n'a pas encore publié d'outil public permettant aux particuliers et aux entreprises de reproduire des voix à partir de courts clips, comme le fait Voice Engine. Selon Harris, la capacité de reproduire n’importe quelle voix de cette manière constitue un risque. Il a souligné que cette technologie pourrait être particulièrement dangereuse en période électorale.

Laisser un commentaire