Skin dans le jeu : les applications de chat vidéo vantent des fonctionnalités d’IA « inclusives »


Les services de visioconférence se vantent depuis des années que leur technologie est « intuitive » à utiliser ou « intégrée » pour fonctionner avec d’autres outils, mais désormais, des fournisseurs tels que Google et Cisco peuvent difficilement publier un article de blog sans vanter un attribut différent : « inclusif ».

Le dernier mot à la mode, et le développement de produits qui l’accompagne, montre comment les entreprises technologiques se concentrent depuis peu pour assurer aux utilisateurs noirs et aux autres personnes de couleur que les produits de chat en ligne ne les laisseront pas de côté. Les changements découlent en partie de la montée du mouvement Black Lives Matter – qui a incité les vendeurs et les clients à penser au-delà des besoins d’un public anglophone blanc – et la pandémie, qui a créé une grande main-d’œuvre « à distance » fortement dépendante sur la technologie.

Ce mois-ci, Google d’Alphabet Inc (GOOGL.O) prévoit de déployer une fonctionnalité d’intelligence artificielle (IA) qui résout le problème de longue date des tons chair plus foncés sous-éclairés dans les chats vidéo.

Cisco Systems Inc (CSCO.O) a lancé en janvier une fonctionnalité de reconnaissance des gestes pour afficher un pouce levé dans Webex, en veillant à ce que les tons chair n’affectent pas les performances. GoToMeeting de LogMeIn Inc, les équipes de Microsoft Corp (MSFT.O) et le Workplace de Facebook Inc (FB.O) ajoutent des options de traduction ou de prononciation dans ce qu’ils décrivent comme une poussée d’équité.

« La technologie n’est fondamentalement pas aujourd’hui aussi inclusive que vous le souhaitez », a déclaré Jeetu Patel, vice-président senior et directeur général de la sécurité et de la collaboration de Cisco. Fixer « des valeurs et des principes qu’un produit doit défendre » est devenu essentiel, a-t-il déclaré.

L’industrie de la technologie est depuis longtemps critiquée pour son piètre bilan en matière de diversité sur le lieu de travail et son incapacité à reconnaître les façons dont la conception de produits peut perpétuer la discrimination.

Les inquiétudes concernant les préjugés dans la vidéoconférence ont repris en septembre dernier après que Colin Madland, étudiant au doctorat à l’Université de Victoria en Colombie-Britannique, Canada, a tweeté une capture d’écran d’un collègue noir apparaissant sans tête lors du déploiement d’un arrière-plan virtuel sur Zoom.

Des études sur d’autres systèmes de culture d’IA ont montré qu’ils généraient plus d’erreurs avec une peau plus foncée, en partie parce que les données utilisées pour les entraîner comprenaient principalement des exemples plus clairs.

Le responsable de la diversité de Zoom, Damien Hooper-Campbell, a déclaré à Reuters: « Le biais n’était pas en jeu, mais plutôt une combinaison de la distance de l’utilisateur par rapport à la caméra, de l’utilisation d’écouteurs et de la position assise. »

Madland a déclaré que le problème s’était calmé après que son collègue ait acheté un écran vert et un « éclairage élégant ».

Pour Zoom (ZM.O) et ses rivaux, assurer l’inclusion pourrait fournir un avantage tout en rivalisant pour des accords post-pandémiques avec des clients – qui sont confrontés à leurs propres calculs en matière de diversité.

Les dépenses mondiales consacrées aux conférences basées sur le cloud devraient atteindre 5,41 milliards de dollars cette année, contre 5,02 milliards de dollars en 2020, selon le cabinet de conseil en technologie Gartner. Il ne suit pas les parts de marché, mais les analystes citent Zoom et Cisco comme les leaders.

« PAS ÉGALEMENT REPRÉSENTÉ »

La prochaine fonctionnalité de Google Meet s’attaque au problème des personnes qui semblent plus sombres en raison de leur environnement, par exemple lorsqu’elles sont assises devant une fenêtre, a déclaré Niklas Blum, un chef de produit Google impliqué dans Meet.

« Les utilisateurs à la peau foncée ne sont pas représentés de manière égale et nous voulons créer des produits pour tout le monde », a-t-il déclaré.

L’IA sépare les utilisateurs de leur arrière-plan, détermine s’ils sont sous-exposés quel que soit leur teint, éclaircit l’image en conséquence et fusionne enfin l’arrière-plan et le premier plan.

La salle d’attente virtuelle de Meet invitera les utilisateurs à activer le réglage de l’éclairage lorsqu’il détectera qu’ils pourraient en bénéficier, a déclaré Stéphane Hulaud, chef de produit pour la qualité et le traitement vidéo de Meet.

Blum et Hulaud ont déclaré que Meet avait d’abord identifié les problèmes de représentation en vidéo lors du lancement d’une amélioration de la faible luminosité pour les appels mobiles bien avant la pandémie. Le développement de la dernière fonctionnalité a pris un temps considérable, mais cela a conduit Meet à établir des procédures de test d’inclusion de produits et à les mandater pour l’ensemble de son travail.

Google recherche également des correctifs supplémentaires. Meet incite les fabricants d’ordinateurs portables et les systèmes d’exploitation à partager un meilleur contrôle sur la balance des blancs et l’exposition des caméras. En interne, Google a adopté des exigences minimales de réflexion de la lumière pour les conceptions de salles de conférence.

Chez Cisco, la nouvelle option de reconnaissance des gestes, lorsqu’elle est activée, permet aux utilisateurs de maintenir leur pouce sur la caméra pendant environ une seconde pour générer un pouce levé virtuel à l’écran.

Cisco a formé son IA à se concentrer sur le contour de la forme et le mouvement du geste dans le temps et dans l’espace, réduisant ainsi les problèmes potentiels liés à la variation du teint de la peau, a déclaré Keith Griffin, ingénieur éminent de l’entreprise.

Les mains en prière – pour « merci » – font partie des nouvelles options gestuelles à venir, avec une fonctionnalité qui interprète la langue des signes comme un objectif éventuel. Webex prévoit également d’ajouter des options de tons chair au-delà du jaune pour les icônes.

Mike Sharp, directeur des produits de LogMeIn pour les communications unifiées et la collaboration, a déclaré que les clients de l’éducation ont été à l’origine de certaines des mises à jour « d’inclusion » de l’entreprise.

Par exemple, la prise en charge prochaine de l’espagnol, du mandarin et d’autres langues dans les messages vocaux et les transcriptions profitera à un district scolaire californien non identifié qui souhaitait mieux s’engager avec sa communauté, a déclaré Sharp.

Facebook Workplace, une suite d’outils de communication d’entreprise, a déclaré le mois dernier que les animateurs vidéo de la mairie verraient bientôt la prononciation des noms des travailleurs posant des questions écrites.

Le chef de produit, Ujjwal Singh, a déclaré que les pointeurs, générés par l’IA mais modifiables, visaient à aider les dirigeants de clients tels que Nestlé SA (NESN.S) et Booking Holdings Inc (BKNG.O) à s’adresser correctement à leurs collègues et à promouvoir l’inclusion.

« Je ne veux pas le prononcer mal à des milliers d’employés et donner l’impression que je ne suis pas en contact avec l’entreprise », a-t-il déclaré.

Nos normes : les principes de confiance de Thomson Reuters.



Laisser un commentaire