La seule chose pour laquelle le métaverse est bon : conduire une technologie en petit langage


Le métaverse est un sujet qui suscite des émotions – les gens ont tendance à être divisés en catégories de hype, sceptique et dédaigneux.

Les entreprises technologiques espèrent que ce sera la prochaine grande chose. Heck, Facebook a même changé son nom en Meta en prévision de la nouvelle technologie et a investi plus de 15 milliards de dollars dans la construction de ce nouveau monde virtuel.

Mais le pari n’est pas payant. Du moins, pas maintenant. La valeur de Meta a chuté de 700 milliards de dollars, les casques AR/VR nécessaires pour entrer dans le Metaverse ne se sont toujours pas généralisés et les investisseurs disent qu’ils ne voient pas la valeur du concept.

On pourrait dire que jusqu’à présent, le projet Metaverse a été un flop. À l’exception d’un domaine – le développement de la technologie en petit langage. Grâce à la promesse du Metaverse, des entreprises telles que Google, NVIDIA et Meta elles-mêmes se lancent dans la réduction du fossé technologique en petit langage en utilisant l’IA pour la traduction de la parole à la parole (S2S).

C’est une bonne nouvelle pour les petits pays aux langues obscures qui n’ont jusqu’à présent pas figuré en tête de liste des priorités des géants de la technologie linguistique comme Google Traduction. Et bien qu’il y ait eu des efforts pour développer des technologies de traduction pour les petites langues auparavant, la montée (promise) du métaverse les a propulsées sous les feux de la rampe.

Métaverse pour la technologie d’IA en petit langage

Le Metaverse est le concept d’un monde virtuel/numérique partagé auquel vous pouvez accéder via des casques VR/AR, vous promener, interagir avec l’environnement et rencontrer d’autres personnes. L’espace est entièrement virtuel, et tout comme Internet, il n’a pas de frontières. Et c’est là que réside le problème. Si des personnes qui parlent des langues différentes se rencontrent, elles ne pourront pas se parler.

Les grands géants de la technologie se sont jusqu’à présent concentrés sur le développement de technologies pour traduire des langues plus grandes, ont développé les algorithmes pour eux et ont essayé d’appliquer simplement ces principes à toutes les autres langues. Cela en fait une bonne expérience pour les grands locuteurs de langues, mais la précision de la traduction diminue considérablement lorsque vous commencez à ajouter de petites langues dans le mélange. Il en résulte une disparité dans la disponibilité des produits technologiques pour les petits locuteurs de langue. Siri, par exemple, ne parle pas le letton. Il faudra beaucoup plus de temps aux technologies linguistiques pour atteindre les petits locuteurs.

Mais cela va changer grâce au Metaverse. Étant donné que l’une des principales conditions d’adoption est de détruire les barrières linguistiques dans le métaverse, les parties impliquées (c’est-à-dire celles qui sont les plus susceptibles de construire et/ou de bénéficier du métaverse) sont intéressées à résoudre ce problème.

Pour cette raison, Google, Meta et NVIDIA ont tous annoncé leur intention de développer des technologies pour prendre en charge les petites langues dans la traduction S2S.

Les géants de la technologie sont-ils en retard dans le jeu de l’IA en petit langage ?

Au cours du mois dernier, Google a annoncé le lancement de Translation Hub pour la traduction de documents et d’un modèle vocal universel basé sur l’IA. Meta a également annoncé un traducteur vocal universel (UST), qui peut traiter à la fois les langues écrites et non écrites. NVIDIA a rapidement enchaîné avec sa propre annonce – un écosystème d’IA vocale pour accélérer la croissance des modèles de reconnaissance vocale automatique.

Mais sont-ils en retard pour le match ?

Le PDG de Tilde, Andrejs Vasiljevs, affirme que ces actions sont tardives. Les langues plus petites ont été négligées par les géants de la technologie pendant des décennies. Pour répondre aux besoins de ces communautés, Tilde développe des technologies de parole et de traduction basées sur l’IA depuis une bonne partie de la décennie. Non seulement cela, mais ils ont également battu tous les autres fournisseurs de traduction automatique dans la compétition WMT – un peu comme les Jeux olympiques de la traduction automatique – trois années de suite en démontrant des niveaux de précision plus élevés dans la catégorie « petites langues ».

Comment une petite entreprise lettone a-t-elle battu les principaux fournisseurs mondiaux de technologies de traduction ? En développant d’abord la technologie de l’IA pour certaines des langues les plus grammaticalement complexes au monde, puis en appliquant ces algorithmes à d’autres langues.

« Google et d’autres entreprises se concentrent d’abord sur les grands langages, et essaient ensuite d’appliquer ces algorithmes sur des langages plus petits. Cela ne fonctionne pas efficacement. Ce que nous avons fait à la place, c’est commencer par les langages complexes, qui nécessitaient une approche différente de la formation de l’IA. En anglais, vous n’avez que 500 000 à 700 000 formes de mots possibles. En letton, par exemple, vous avez plus de 22 millions de formes de mots possibles. En utilisant ces méthodes, nous pouvons appliquer l’IA avec succès à d’autres langues, comme l’estonien et le finnois. » – Andrejs Vasiljevs

L’IA de Tilde a déjà été intégrée aux produits Microsoft et est également devenue l’outil de traduction officiel du bureau du Premier ministre finlandais. La société se réjouit de la nouvelle selon laquelle les grands acteurs accordent plus d’attention aux petites langues, mais reste sceptique quant à leur capacité à le faire aussi bien.

« C’est une chose d’annoncer que vous allez le faire, mais tant que vous n’aurez pas testé l’exactitude des traductions, vous ne pourrez pas déterminer le succès de l’effort. De plus, les traductions à taille unique ne conviennent pas toujours à tout le monde. Nos hauts niveaux de précision reposent sur la capacité non seulement à former spécifiquement une IA dans un petit langage, mais aussi pour un secteur spécifique – les affaires juridiques ou la construction, par exemple. Tout comme les traducteurs humains, il ne suffit pas de maîtriser une langue, il faut aussi être un spécialiste du sujet.

Bien que les dernières annonces semblent prometteuses, Vasiljevs soutient que l’IA universelle et de haute précision dans les petites langues est toujours hors de portée des entreprises les mieux financées.

Une technologie habilitante au détriment de la vie privée ?

Un aspect que Vasiljevs met en évidence est que les produits freemium, comme Google et Meta, offrent leurs services en échange du droit de faire ce qu’ils veulent avec leurs données d’utilisateur. À une époque où la confidentialité est une préoccupation, il vaut la peine de prendre un moment pour réfléchir aux services que vous utilisez, aux informations que vous traitez, qui a accès à ces données et si cela vous convient.

C’est un point valable si l’on considère le métaverse, où chaque mot prononcé deviendrait alors des données traitées par celui qui fournit le moteur de traduction, en supposant que leurs conditions d’utilisation donnent accès à ces données. Voulons-nous alors mettre chaque mot prononcé (dans le métaverse) entre les mains d’entreprises qui ont une réputation moins que reluisante en matière de gestion des données ? Avec environ 8,4 milliards d’assistants vocaux dans les appareils d’ici 2024, il semble que le monde soit à l’aise avec la transmission de leurs données vocales.

Dans l’ensemble, le développement inévitable du métaverse semble susciter l’intérêt pour la technologie des petits langages. Et bien que nous ne sachions pas ce que l’avenir nous réserve en termes de vie en réalité virtuelle, nous savons que la communication entre nous deviendra un peu plus facile.


A propos de l’auteur

Julia Gifford est la cofondatrice de Truesix, une agence primée de marketing de contenu et de relations publiques axée sur la visibilité des organisations de haute technologie. Elle faisait partie de l’équipe fondatrice de Printful, la première licorne startup de Lettonie. Elle est rédactrice et contributrice chez Labs of Latvia et Tech.eu, l’une des principales plateformes d’information sur les startups en Europe.

Image en vedette : ©agungkreatif


Laisser un commentaire