L’art généré par l’IA illustre un autre problème avec la technologie | Jean Naughton
jeTout a commencé avec le titre d’une entrée dans le bulletin d’information Galaxy Brain de Charlie Warzel dans le atlantique: « Où va Alex Jones à partir d’ici? » C’est une question intéressante car Jones est un troll Internet si extrême qu’il fait ressembler Donald Trump à Spinoza. Pendant de nombreuses années, il a transformé un talk-show radio et un site Web en une entreprise confortable de plusieurs millions de dollars colportant des bêtises, des théories du complot, des mensonges et des marchandises étranges à une immense tribu d’adhérents. Et jusqu’au 4 août, il s’en était tiré. Ce jour-là, cependant, il a perdu une affaire de diffamation épique intentée contre lui par des parents d’enfants décédés lors du massacre de Sandy Hook en 2012 – une tragédie qu’il avait constamment ridiculisée comme un canular mis en scène ; un jury texan a décidé qu’il devait payer près de 50 millions de dollars de dommages et intérêts pour avoir publié cette absurdité sadique.
La newsletter de Warzel consistait en une interview avec quelqu’un qui avait travaillé pour l’empire médiatique Jones à son apogée et, en tant que tel, était intéressant. Mais ce qui a vraiment attiré mon attention, c’est l’illustration saisissante qui dirigeait la pièce. Il montrait une image caricaturale d’un Jones échevelé dans une sorte de caverne entourée de papiers, de billets de banque, d’ordonnances et d’autres types de documents. Plutôt bon, ai-je pensé, puis j’ai inspecté la légende pour voir qui était l’artiste. La réponse : « L’art de l’IA par Midjourney ».
Ah ! Midjourney est un laboratoire de recherche et également le nom de son programme qui crée des images à partir de descriptions textuelles à l’aide d’un système d’apprentissage automatique similaire au système Dall-E d’OpenAI. Alors quelqu’un sur le atlantique avait simplement tapé « Alex Jones dans un bureau américain sous des lumières fluorescentes » dans une zone de texte et – bingo ! – l’illustration qui avait retenu mon attention était l’une des images qu’elle avait générées.
Il s’avère que le atlantique n’est pas la seule publication établie dans laquelle le travail de l’outil Midjourney est apparu. Le normalement assis Économiste, par exemple, l’a déployé récemment pour produire sa couverture du 11 juin. Ceci est important car il illustre la rapidité avec laquelle les technologies numériques peuvent passer de la pointe à la marchandisation. Et ce faisant, de nouvelles peurs et de nouveaux espoirs émergent rapidement.
Dall-E (le nom est une combinaison geek du personnage Pixar Wall-E et de Salvador Dalí) est dérivé des modèles de langage GPT pionniers d’OpenAI, qui peuvent générer un texte anglais vaguement plausible. Dall-E échange essentiellement des pixels contre du texte et a été formé sur 400 millions de paires d’images avec des légendes de texte qui ont été « grattées » sur Internet. (L’empreinte carbone du calcul impliqué dans ce processus est inadmissible, mais c’est pour un autre jour.)
Lorsque le GPT-3 est apparu, il a déclenché un nouvel épisode du débat « augmentation v remplacement ». La technologie n’était-elle que le bord mince d’un coin sinistre? Le GPT-3 pourrait être utilisé pour « écrire » des textes ennuyeux mais utiles – des rapports boursiers, par exemple – mais il pourrait également générer une désinformation nocive et apparemment crédible qui passerait à travers les systèmes de modération des plateformes de médias sociaux. Il pourrait être utilisé pour augmenter les capacités des journalistes occupés et surmenés ou pour s’en passer entièrement. Etc.
En l’occurrence, cependant, une partie de la vapeur est sortie de la controverse GPT-3 (mais pas hors de question des coûts environnementaux d’une telle informatique extravagante). Quel que soit le nombre de sceptiques et de critiques qui pourraient ridiculiser les hacks humains, le bois tordu de l’humanité continuera à déjouer les simples machines dans un avenir prévisible. Les écoles de journalisme peuvent se détendre.
Dall-E pourrait cependant s’avérer être un cas moins simple. Comme avec GPT-3, son apparence a suscité un vif intérêt, peut-être parce que si la plupart des gens peuvent écrire du texte, beaucoup d’entre nous ne peuvent pas dessiner pour sauver nos vies. Donc avoir un outil qui pourrait nous permettre de pallier ce handicap serait une aubaine. Vous pourriez, par exemple, demander un portrait de Shrek dans le style de la Joconde ou de Jane Austen en tant qu’astronaute et encore une fois, il ferait de son mieux. On peut donc y voir une augmentation bienvenue des capacités humaines.
Mais il y a aussi la question du « remplacement ». Il s’avère que c’était Warzel lui-même qui avait utilisé le bot de Midjourney pour créer une illustration plutôt que d’en obtenir une à partir d’une banque d’images protégée par le droit d’auteur ou de demander à un artiste de créer une image. Grosse erreur : un artiste a repéré la légende et a tweeté qu’il était choqué qu’un magazine national comme le atlantique utilisait un programme informatique pour illustrer des histoires au lieu de payer un artiste pour faire ce travail, donnant ainsi à d’autres publications l’idée de faire de même. Avant de pouvoir dire « IA », Warzel s’est retrouvé à jouer le méchant dans une tempête de tweets virale. Ce qui était douloureux pour lui, mais peut-être aussi un avertissement salutaire que les éditeurs qui donnent du travail aux machines plutôt qu’aux créateurs méritent tout ce qu’ils obtiennent.
Ce que j’ai lu
Bon fonctionnement
Les véhicules électriques sont bien plus économes en énergie que les véhicules à combustion interne est un résumé qui donne à réfléchir du projet Yale Climate Connections.
Aller mieux
The Efficiency Movement est un merveilleux essai de Rob Miller sur la façon dont toutes les sociétés modernes ont été façonnées par leur culte de l’efficacité.
Horloge biologique
Le site Nautilus contient un article fascinant sur les mystères évolutifs de la ménopause.