Hands-on with DALL-E 2, the AI Image Generator Taking the Web by Storm

On a beaucoup parlé des images générées par l’IA et de l’art visuel. L’un des projets que j’ai trouvé le plus impressionnant était le DALL-E 2. Il s’agit d’un nouveau système d’IA capable de créer des images réalistes et de l’art à partir d’une description en langage naturel.

J’ai mis mon e-mail sur la liste d’attente car le DALL-E 2 est sur invitation uniquement pour le moment. Quelques jours plus tard, l’invitation est arrivée. Au lieu de me concentrer sur un travail plus significatif, je me suis attardé avec le système. Voici ce que j’ai obtenu…

Annotations en langage naturel

Je suis avant tout un photographe de paysage, donc je voulais tester quand l’IA me changerait. La première description que j’ai écrite était “des montagnes enneigées avec un arc-en-ciel et une licorne volante”. Et DALL-E 2 a créé ceci,

“MONTAGNES COUVERTES DE NEIGE AVEC UN ARC-EN-CIEL ET UN UNIFORME VOLANT”
“MONTAGNES COUVERTES DE NEIGE AVEC UN ARC-EN-CIEL ET UN UNIFORME VOLANT”
“MONTAGNES COUVERTES DE NEIGE AVEC UN ARC-EN-CIEL ET UN UNIFORME VOLANT”
“MONTAGNES COUVERTES DE NEIGE AVEC UN ARC-EN-CIEL ET UN UNIFORME VOLANT”

Honnêtement, je peux vaquer à mes occupations pour l’instant ! Ensuite, j’ai essayé quelque chose de plus réaliste, “belle cascade avec beaucoup de mousse verte et de rochers au premier plan”.

“BELLE CHUTE D’EAU AVEC BEAUCOUP DE MOUSSE VERTE ET DE ROCHES DEVANT”
“BELLE CHUTE D’EAU AVEC BEAUCOUP DE MOUSSE VERTE et de rochers devant”
“BELLE CHUTE D’EAU AVEC BEAUCOUP DE MOUSSE VERTE et de rochers devant”
“BELLE CHUTE D’EAU AVEC BEAUCOUP DE MOUSSE VERTE et de rochers devant”

Si ce qui précède est bien généré par l’IA, je suis impressionné ! Ça a l’air réel. Alors je suis parti avec la “forêt d’automne dans le brouillard”.

“FORÊT D’AUTOMNE DANS LES BROUILLARDS”
“FORÊT D’AUTOMNE DANS LES BROUILLARDS”
“FORÊT D’AUTOMNE DANS LES BROUILLARDS”
“FORÊT D’AUTOMNE DANS LES BROUILLARDS”

C’était un peu ennuyeux, alors j’ai ajouté “forêt d’automne avec des champignons dans le brouillard”.

“FORÊT D’AUTOMNE EN FUGS AVEC CHAMPIGNON AU SOL”
“FORÊT D’AUTOMNE EN FUGS AVEC CHAMPIGNON AU SOL”
“FORÊT D’AUTOMNE EN FUGS AVEC CHAMPIGNON AU SOL”
“FORÊT D’AUTOMNE EN FUGS AVEC CHAMPIGNON AU SOL”

Toujours impressionnant ! Essayons quelque chose de plus difficile, “forêt d’automne dans le brouillard avec des champignons au sol et un cerf dans le dos”.

« CHAMPIGNON EN PLACE, FORÊT D’AUTOMNE DANS LES BROUILLARDS AVEC DES FILLES À L’ARRIÈRE »
« CHAMPIGNON EN PLACE, FORÊT D’AUTOMNE DANS LES BROUILLARDS AVEC DES FILLES À L’ARRIÈRE »
« CHAMPIGNON EN PLACE, FORÊT D’AUTOMNE DANS LES BROUILLARDS AVEC DES FILLES À L’ARRIÈRE »
« CHAMPIGNON EN PLACE, FORÊT D’AUTOMNE DANS LES BROUILLARDS AVEC DES FILLES À L’ARRIÈRE »

Moins impressionnant… J’aime l’intelligence artificielle qui ajoute les oiseaux et les champignons qui commencent à s’élever dans les airs.

Téléchargement de mes propres photos

DALL-E 2 vous offre la possibilité de télécharger vos propres images, puis le système crée des variantes. Cela semble également intéressant et pourrait constituer un test encore plus important de la force de l’IA. L’IA doit “lire” l’image, puis créer des alternatives significatives. Comment cela a-t-il fonctionné ? Voyons voir.

Lac de Bled, Slovénie – Image source originale.

Mon image d’automne du lac de Bled semblait être l’exemple parfait à tester. La composition, les couleurs et le sujet sont complètement différents et doivent être faciles à copier.

Les variations résultantes créées par l’IA sont :

Ensuite, je voulais tester comment DALL-E 2 restitue les personnes dans l’image. J’ai téléchargé un de mes portraits de voyage et j’ai reçu ce message :

Assez juste, c’est logique. Alors je l’ai essayé avec une personne plus silhouettée sans visage reconnaissable. Cette fois ça a marché.

Vues depuis le sommet de Taljanka, montagnes albanaises — Image source originale.

Voici les variantes générées par l’IA :

Le photographe et son appareil photo sont à la fois anormalement tordus et déformés. Les couches de montagne sont toutes très réalistes et évidemment modifiées.

Modification d’images existantes

Après avoir téléchargé vos propres images, vous avez la possibilité de les modifier à l’aide d’un pinceau sur une partie de l’image et d’expliquer dans le texte ce que vous souhaitez créer dans cette zone. Voici quelques résultats…

“LES OISEAUX NOIR VOLENT”
“LES OISEAUX NOIR VOLENT”
“LES OISEAUX NOIR VOLENT”
“LES OISEAUX NOIR VOLENT”
“LAND ROVER DEFENDER EST STATIONNÉ SUR L’HERBE COMME UNE TENTE DE LAVAGE”
“LAND ROVER DEFENDER EST STATIONNÉ SUR L’HERBE COMME UNE TENTE DE LAVAGE”
“LAND ROVER DEFENDER EST STATIONNÉ SUR L’HERBE COMME UNE TENTE DE LAVAGE”
“LAND ROVER DEFENDER EST STATIONNÉ SUR L’HERBE COMME UNE TENTE DE LAVAGE”
« Troupeau de moutons assis sur l’herbe »
« Troupeau de moutons assis sur l’herbe »
« Troupeau de moutons assis sur l’herbe »

Comme vous pouvez le voir, ce n’est pas très impressionnant. C’est amusant mais en aucun cas réaliste. Les Land Rover sont plutôt bons, mais les moutons ou les oiseaux sont clairement faux. Vous trouverez ci-dessous les images originales que j’ai utilisées pour créer les variations ci-dessus :

La solution

L’IA a certainement fait de grands progrès ces dernières années. Nous avons vu de la musique composée par des ordinateurs, fausses vidéos profondes de personnes décédées célèbres, et maintenant les images sont créées simplement en entrant des descriptions textuelles ! Je ne sais pas si l’IA est le bon terme, car il s’agit d’un ensemble d’algorithmes qui apprennent et évoluent en y introduisant plus de données. Quoi qu’il en soit, les résultats que j’ai obtenus en jouant étaient meilleurs que ce à quoi je m’attendais. Il y a beaucoup de résultats complètement stupides, mais parfois l’algorithme le fait très bien.

Je vois à quel point cela pourrait être utile à l’avenir. Et comme il sera facile d’en abuser. Cependant, la technologie en est encore à ses balbutiements. En ce moment, je le vois plus ou moins comme un jouet d’expérimentation. Peut-être que dans quelques années, cela changera et nous verrons un flot d’images incroyables qui n’ont rien à voir avec la réalité. Ensuite, je crois que le véritable art photographique n’est que Suite de valeur.


A propos de l’auteur: Luka Esenko est un photographe basé à Ljubljana, en Slovénie. Les opinions exprimées dans cet article n’engagent que l’auteur. Esenko enseigne des ateliers de photographie en Slovénie et dans les environs et est également co-fondateur de Photohound. Vous pouvez trouver plus de son travail sur son site Web, excitation, et Instagram. Cet article a également été publié ici.

Leave a Comment