Le monde étrange et merveilleux des images générées par l’IA pour le cyclisme
Il y a quelques années, chez CyclingTips, nous avons écrit un article abordant la question (un peu idiote) : l’IA pourrait-elle être sur le point de voler nos emplois d’écrivains cyclistes ? La réponse, bien sûr, était « non » (du moins pas encore), mais c’était toujours amusant de plonger dans le monde fascinant des réseaux de neurones et du texte généré par l’IA.
Le concept derrière la technologie est simple : donnez au moteur d’intelligence artificielle une invite de texte, et il crachera un long passage de texte pour vous, construit sur votre invite et puisant dans la myriade de textes sur lesquels il a été formé. Les résultats sont souvent fascinants et plus qu’un peu divertissants.
Aujourd’hui, nous replongeons dans le monde des réseaux de neurones avec un regard sur les technologies générées par l’IA imagerie. Prenez note, photographes cyclistes professionnels.
Au cours des deux dernières années, nous avons assisté à une explosion du nombre de plates-formes de génération d’images d’IA disponibles en ligne. Vous avez peut-être entendu parler de DALL-E 2, créé par le laboratoire OpenAI fondé par Elon Musk, ou de son cousin allégé Craiyon (anciennement DALL-E mini). Midjourney a également fait sensation ces derniers mois, en particulier dans le monde de l’art fantastique, mais ce ne sont là que quelques-unes des nombreuses options disponibles.
Ces plates-formes fonctionnent toutes un peu comme les générateurs de texte AI dont nous avons parlé la dernière fois. Sous le capot de ces sites et applications se trouvent des réseaux de neurones qui ont été formés sur d’énormes bibliothèques d’images existantes et leurs descriptions pour comprendre à quoi ressemblent certains objets et comment ils interagissent les uns avec les autres. Lorsque vous alimentez ces routines d’IA avec une invite de texte, elles font de leur mieux pour créer une image qui correspond à cette invite, en fonction de l’apprentissage qu’elles ont fait.
Certains des résultats sont vraiment époustouflants.
Après avoir observé la croissance de cet espace, cela nous a fait réfléchir : qu’est-ce qui est possible dans vélo avec des images générées par l’IA ? Que créeraient ces plates-formes d’IA si nous alimentions un tas d’invites liées au cyclisme ? Et l’un d’entre eux conviendrait-il à une utilisation sur CyclingTips, par exemple ?
Et donc nous avons joué avec un tas d’outils gratuits : Enstil, Craiyon, Stable Diffusion, Midjourney et DreamStudio, alimentant un tas de mots-clés différents liés au cyclisme. Les résultats, nous sommes sûrs que vous en conviendrez, sont fascinants, divertissants et, dans certains cas, plus qu’horrifiants.
Nous avons commencé par une simple invite : « un cycliste qui monte une montagne ». Voici ce que nous avons obtenu de DreamStudio :
Il y a aussi beaucoup à prendre dans cet effort de DreamStudio :
Voici quelques tentatives de Stable Diffusion :
Et certains d’Enstil :
Ensuite, nous avons essayé le mot « peloton ».
Voici comment Enstil a interprété « peloton »:
Très bien, disons que vous êtes un concepteur de vélos et que vous recherchez des idées futuristes pour vous aider avec votre prochain modèle. Peut-être vous tournez-vous vers l’IA pour vous inspirer ? Voici ce que vous obtiendriez si vous laissiez tomber « Vélo de gravier à suspension intégrale spécialisé » dans DreamStudio, par exemple.
En parlant de beaucoup de tubes…
Jetons un coup d’œil à ce que certaines IA font d’un « vélo à la pointe de la technologie dans une salle d’exposition ». Voici d’abord la diffusion stable :
On dirait que nous n’avons pas besoin d’envoyer James ou Dave à Eurobike l’année prochaine.
Enstil avait aussi quelques idées :
La salle d’exposition envisagée par DreamStudio était peut-être un peu trop encombrée.
Voici Midjourney avec l’invite « une salle d’exposition pleine de vélos futuristes »:
Changement de vitesse, que diriez-vous de quelques portraits rapprochés de cyclistes ?
La pratique du gravel fait fureur en ce moment. Voyons ce que l’IA en fait.
Voici « Un cycliste célébrant la victoire dans une course cycliste », premier de l’Enstil :
Voici l’effort de Stable Diffusion avec la même invite :
En parlant de visages, Craiyon semble vraiment avoir du mal à cet égard.
Voici une série de Stable Diffusion qui s’est étonnamment bien déroulée à partir de l’invite « noir et blanc, film fixe, visage peiné, cycliste, vélo ». Quelqu’un cherche-t-il une pochette pour son nouvel album de rock indépendant ?
Très bien, passons en revue un tas d’images supplémentaires générées à partir d’un tas d’invites différentes.
D’accord, donc beaucoup de ceci est assez stupide et inutilisable. Mais il existe des moyens d’amener l’IA à créer des images un peu plus utiles. L’utilisation de plates-formes d’IA plus riches en fonctionnalités et bien développées est un moyen (DALL-E 2 semble être l’étalon-or mais l’accès est limité pour le moment). Ou vous pouvez essayer de demander à l’IA d’être plus artistique plutôt que photoréaliste.
En parlant d’artistique, il est possible de générer des trucs vraiment merveilleux avec Midjourney. Découvrez ces deux superbes images générées à partir de l’invite « esquisse d’un vélo de route futuriste par Léonard de Vinci »:
Mieux encore : que diriez-vous de quelques portraits à la Pixar de certains pilotes ?
Ce ne sont que des images vraiment impressionnantes de Midjourney. Ce qui nous ramène à l’une de nos questions initiales : l’IA est-elle capable de générer des images suffisamment bonnes pour être utilisées sur un site Web professionnel ?
Pour la plupart des images ci-dessus, la réponse est un non assez décisif (aussi amusant qu’elles soient à regarder). Mais dans le cas des créations plus artistiques ou abstraites ? Il y a là un potentiel évident.
Chez CyclingTips, nous recherchons souvent des photos non liées à la course pour aider à illustrer des articles sur divers sujets. Il peut être difficile de trouver une photo qui parle, par exemple, de la sécurité routière ou des bienfaits du vélo sur la santé mentale. L’IA pourrait clairement aider à cet égard, en particulier si une image plus abstraite ou stylistique est appropriée. Comme vous pouvez le voir ci-dessus, Midjourney vous permet déjà de créer un contenu formidable uniquement à cette fin.
Il y a, bien sûr, un dilemme éthique à résoudre ici. Utiliser l’IA pour générer des images comme celle-ci enlève directement des emplois à ceux qui font ce genre de choses pour gagner leur vie. Il n’est pas surprenant qu’il y ait une controverse considérable sur la technologie pour cette raison. Cela et le fait que ces plates-formes génèrent efficacement des images à partir d’images différentes que d’autres ont créées à l’origine – en soi une zone grise éthique.
Nous n’allons pas résoudre ces problèmes aujourd’hui. Ce que nous pouvons dire, cependant, c’est que les photographes de course n’ont pas à s’inquiéter. Exemple : voici l’interprétation d’Enstil de la victoire de Remco Evenepoel à la Vuelta a España.
Et voici un aperçu du podium final de la Vuelta 2022 :
En ce qui concerne au moins les images de course, nous pourrions nous en tenir aux pros pour le moment.