Le monde étrange et merveilleux des images générées par l’IA pour le cyclisme


Il y a quelques années, chez CyclingTips, nous avons écrit un article abordant la question (un peu idiote) : l’IA pourrait-elle être sur le point de voler nos emplois d’écrivains cyclistes ? La réponse, bien sûr, était « non » (du moins pas encore), mais c’était toujours amusant de plonger dans le monde fascinant des réseaux de neurones et du texte généré par l’IA.

Le concept derrière la technologie est simple : donnez au moteur d’intelligence artificielle une invite de texte, et il crachera un long passage de texte pour vous, construit sur votre invite et puisant dans la myriade de textes sur lesquels il a été formé. Les résultats sont souvent fascinants et plus qu’un peu divertissants.

Aujourd’hui, nous replongeons dans le monde des réseaux de neurones avec un regard sur les technologies générées par l’IA imagerie. Prenez note, photographes cyclistes professionnels.

Au cours des deux dernières années, nous avons assisté à une explosion du nombre de plates-formes de génération d’images d’IA disponibles en ligne. Vous avez peut-être entendu parler de DALL-E 2, créé par le laboratoire OpenAI fondé par Elon Musk, ou de son cousin allégé Craiyon (anciennement DALL-E mini). Midjourney a également fait sensation ces derniers mois, en particulier dans le monde de l’art fantastique, mais ce ne sont là que quelques-unes des nombreuses options disponibles.

Ces plates-formes fonctionnent toutes un peu comme les générateurs de texte AI dont nous avons parlé la dernière fois. Sous le capot de ces sites et applications se trouvent des réseaux de neurones qui ont été formés sur d’énormes bibliothèques d’images existantes et leurs descriptions pour comprendre à quoi ressemblent certains objets et comment ils interagissent les uns avec les autres. Lorsque vous alimentez ces routines d’IA avec une invite de texte, elles font de leur mieux pour créer une image qui correspond à cette invite, en fonction de l’apprentissage qu’elles ont fait.

Certains des résultats sont vraiment époustouflants.

Quelques exemples d’art générés par la plateforme Midjourney AI. À titre d’exemple, consultez l’invite qui a été donnée pour la deuxième image à partir de la gauche.
Voici quelques exemples générés par un site appelé Enstil, basé sur l’invite de texte ci-dessus.

Après avoir observé la croissance de cet espace, cela nous a fait réfléchir : qu’est-ce qui est possible dans vélo avec des images générées par l’IA ? Que créeraient ces plates-formes d’IA si nous alimentions un tas d’invites liées au cyclisme ? Et l’un d’entre eux conviendrait-il à une utilisation sur CyclingTips, par exemple ?

Et donc nous avons joué avec un tas d’outils gratuits : Enstil, Craiyon, Stable Diffusion, Midjourney et DreamStudio, alimentant un tas de mots-clés différents liés au cyclisme. Les résultats, nous sommes sûrs que vous en conviendrez, sont fascinants, divertissants et, dans certains cas, plus qu’horrifiants.

Nous avons commencé par une simple invite : « un cycliste qui monte une montagne ». Voici ce que nous avons obtenu de DreamStudio :

L’arrière-plan semble être tiré directement d’une autre image, mais ce pilote – il a quelques problèmes.

Il y a aussi beaucoup à prendre dans cet effort de DreamStudio :

Plus vous regardez, plus ça devient bizarre.

Voici quelques tentatives de Stable Diffusion :

Et certains d’Enstil :

Encore une fois, joli paysage. Je me demande d’où ça vient ?
Cette conception de guidon ne fera jamais son chemin.

Ensuite, nous avons essayé le mot « peloton ».

Celui-ci de DreamStudio donne l’impression qu’il pourrait s’agir d’une capture d’écran d’une VHS glitch des années 1980 des faits saillants du Tour de France.

Voici comment Enstil a interprété « peloton »:

Les kits sont-ils de vrais kits ou un méli-mélo d’IA de plusieurs maillots ? Et où est le vélo du vieux pote ?

Très bien, disons que vous êtes un concepteur de vélos et que vous recherchez des idées futuristes pour vous aider avec votre prochain modèle. Peut-être vous tournez-vous vers l’IA pour vous inspirer ? Voici ce que vous obtiendriez si vous laissiez tomber « Vélo de gravier à suspension intégrale spécialisé » dans DreamStudio, par exemple.

J’ai mal à la tête.

En parlant de beaucoup de tubes…

DreamStudio semble aimer doubler.

Jetons un coup d’œil à ce que certaines IA font d’un « vélo à la pointe de la technologie dans une salle d’exposition ». Voici d’abord la diffusion stable :

On dirait que nous n’avons pas besoin d’envoyer James ou Dave à Eurobike l’année prochaine.

Enstil avait aussi quelques idées :

La salle d’exposition envisagée par DreamStudio était peut-être un peu trop encombrée.

Encore une fois avec le doublage.
S’agit-il de rayons ou de toiles d’araignées ?

Voici Midjourney avec l’invite « une salle d’exposition pleine de vélos futuristes »:

J’adore la palette de couleurs ici.

Changement de vitesse, que diriez-vous de quelques portraits rapprochés de cyclistes ?

« Portrait cycliste réaliste en gros plan » de DreamStudio. Ça ressemble un peu aux frères Schleck ? Encore une fois, on ne sait pas pourquoi cela en a généré deux.
Ne plaisante pas avec ces gars (Sam Bennett vibre du type à droite). (Image : Studio de rêve)
Pour une raison quelconque, DreamStudio AI utilise par défaut un portrait masculin, doublé. Voici ce qu’il a généré à partir de « Réaliste, portrait en gros plan d’une cycliste féminine ». Toujours deux. Détail assez impressionnant dans le visage cependant.
Cette. en attendant, c’est juste bouleversant à regarder. (Image : Studio de rêve)
Il ne s’agit pas d’une représentation d’un « gros plan cycliste réaliste ». C’est un spectacle d’horreur.

La pratique du gravel fait fureur en ce moment. Voyons ce que l’IA en fait.

Cela ressemble à une blessure douloureuse à la jambe.
Et cet homme n’a pas d’os du tout.

Voici « Un cycliste célébrant la victoire dans une course cycliste », premier de l’Enstil :

Cela ressemble à une vraie image avec les détails modifiés ?
À peu près la même chose, mais ces visages sont pas bien.

Voici l’effort de Stable Diffusion avec la même invite :

Je suggérerais qu’il garde les pieds sur les pédales, mais on ne sait pas où se trouve sa pédale gauche.
Il est important de mettre de la crème solaire, les enfants.

En parlant de visages, Craiyon semble vraiment avoir du mal à cet égard.

Voici une série de Stable Diffusion qui s’est étonnamment bien déroulée à partir de l’invite « noir et blanc, film fixe, visage peiné, cycliste, vélo ». Quelqu’un cherche-t-il une pochette pour son nouvel album de rock indépendant ?

Très bien, passons en revue un tas d’images supplémentaires générées à partir d’un tas d’invites différentes.

D’accord, donc beaucoup de ceci est assez stupide et inutilisable. Mais il existe des moyens d’amener l’IA à créer des images un peu plus utiles. L’utilisation de plates-formes d’IA plus riches en fonctionnalités et bien développées est un moyen (DALL-E 2 semble être l’étalon-or mais l’accès est limité pour le moment). Ou vous pouvez essayer de demander à l’IA d’être plus artistique plutôt que photoréaliste.

Ceci provient de DreamStudio en utilisant l’invite « sketch, illustration, steampunk, bicycle, high detail ». C’est toujours un gâchis, mais le style est magnifique et il y a un vrai potentiel ici.

En parlant d’artistique, il est possible de générer des trucs vraiment merveilleux avec Midjourney. Découvrez ces deux superbes images générées à partir de l’invite « esquisse d’un vélo de route futuriste par Léonard de Vinci »:

Mieux encore : que diriez-vous de quelques portraits à la Pixar de certains pilotes ?

« Portrait Pixar en gros plan d’un ciel sombre de cycliste masculin ».
« Portrait Pixar gros plan d’une cycliste femme ciel sombre ».

Ce ne sont que des images vraiment impressionnantes de Midjourney. Ce qui nous ramène à l’une de nos questions initiales : l’IA est-elle capable de générer des images suffisamment bonnes pour être utilisées sur un site Web professionnel ?

Pour la plupart des images ci-dessus, la réponse est un non assez décisif (aussi amusant qu’elles soient à regarder). Mais dans le cas des créations plus artistiques ou abstraites ? Il y a là un potentiel évident.

Chez CyclingTips, nous recherchons souvent des photos non liées à la course pour aider à illustrer des articles sur divers sujets. Il peut être difficile de trouver une photo qui parle, par exemple, de la sécurité routière ou des bienfaits du vélo sur la santé mentale. L’IA pourrait clairement aider à cet égard, en particulier si une image plus abstraite ou stylistique est appropriée. Comme vous pouvez le voir ci-dessus, Midjourney vous permet déjà de créer un contenu formidable uniquement à cette fin.

Il y a, bien sûr, un dilemme éthique à résoudre ici. Utiliser l’IA pour générer des images comme celle-ci enlève directement des emplois à ceux qui font ce genre de choses pour gagner leur vie. Il n’est pas surprenant qu’il y ait une controverse considérable sur la technologie pour cette raison. Cela et le fait que ces plates-formes génèrent efficacement des images à partir d’images différentes que d’autres ont créées à l’origine – en soi une zone grise éthique.

Nous n’allons pas résoudre ces problèmes aujourd’hui. Ce que nous pouvons dire, cependant, c’est que les photographes de course n’ont pas à s’inquiéter. Exemple : voici l’interprétation d’Enstil de la victoire de Remco Evenepoel à la Vuelta a España.

Comment vont tes bras, mon pote ?
Doigts pendant des jours.

Et voici un aperçu du podium final de la Vuelta 2022 :

Combien mesure ce gars au milieu ? !
Qu’y a-t-il dans la « main » gauche du coureur au maillot jaune ?

En ce qui concerne au moins les images de course, nous pourrions nous en tenir aux pros pour le moment.

Laisser un commentaire