L'entreprise de recherche en intelligence artificielle OpenAI a présenté la nouvelle version de son générateur d'images via des mots clés : DALL.E 2. Un générateur plus précis et plus compréhensif qui permet de créer d'infinies combinaisons d'images artistiques en haute résolution grâce à la puissance de son outil d'IA.

DALL.E 2 est cependant pour le moment réservé à des groupes de chercheurs le temps que l'IA soit correctement développée et que les risques de mauvaise utilisation soient écartés.

Un texte, une image unique

Dans le champ dédié, marquez « Un astronaute se prélasse dans un hôtel tropical dans l'espace dans un style pixel art » et hop ! Vous obtenez une image avec précisément tout ce que vous avez écrit. Pas fan du résultat final ? Changez « pixel art » par « Van Gogh » ou « astronaute » par « un chien » et l'image apparaît modifiée avec le nouveau résultat. C'est ce que propose donc DALL.E 2, de l'entreprise OpenAI.

© OpenAI
© OpenAI

Lancé en janvier 2021, l'outil DALL.E (un mélange de Salvador Dalí pour le côté artistique et de WALL-E le petit robot pour le côté technologique) permettait déjà de faire peu ou prou la même chose mais, un an de développement plus tard, les chercheurs à l'origine du projet sont capables de sortir une version plus poussée et plus aboutie encore.

Grâce à cet outil encore non disponible pour le grand public, trois choses sont possibles : créer des images à partir de mots clés ; créer des variations d'images déjà existantes (prenez la Joconde et proposez par exemple de l'affubler d'une coupe iroquoise) ou faire fusionner deux images ensemble.

L'intelligence artificielle au cœur

Concrètement comment ça marche ? Le site de l'outil l'explique assez bien. DALL.E 2 utilise un système neuronal entraîné avec des images et leur description. Le deep learning permet à l'outil de comprendre à quel mot appartient quelle image en analysant et en recoupant les modèles de milliers de photos associées à un mot donné. Par exemple, pour le mot « koala », l'outil aura auparavant exploré la base de données de millions de photos pour définir ce qu'est un koala.

Lors de la création de l'image, l'outil utilise un procédé dit de « diffusion ». En partant d'un modèle de points placés aléatoirement, il le modifie graduellement vers une image lorsqu'il reconnaît des aspects spécifiques de cette image. Évidemment, il y a des limites. Si un avion a dans sa description le mot « voiture », lorsqu'on veut créer une voiture cela pourra mettre l'image d'un avion puisque pour l'IA, une voiture est alors un avion.

DALL.E 2 est un projet de recherche et n'est donc pas disponible sur l'API. Un groupe sélectionné d'utilisateurs participe à la recherche et seulement des chercheurs de confiance peuvent s'inscrire pour participer. Des travaux sur la sécurité de l'outil sont menés afin de prévenir la génération d'images violentes, haineuses, politiques ou pornographiques. Interdiction également de créer des images en utilisant des photos de personnes réelles ou de personnalités.