Pourquoi utiliser DALL·E ?
DALL·E (le nom est un jeu de mot entre Salvador Dali et de WALL-E de Pixar) est un générateur d'images basé sur le machine learning et tout particulièrement l'algorithme GPT-3. Créé par la société d'intelligence artificielle OpenAI, c'est un outil génératif, ce qui signifie que les utilisateurs peuvent générer de l'art à partir de zéro en utilisant le langage naturel (en d'autres termes, notre langage humain).
OpenAI propose d'utiliser DALL·E de deux manières. La première consiste à utiliser l'invité de texte et générer ses images directement. L'autre est d'utiliser l'API mise à disposition. Cette seconde méthode est bien plus complexe à mettre en oeuvre. De ce fait, la majorité des utilisateurs préféreront utiliser DALL·E directement sur le site d'OpenAI.
Pour les utilisateurs en panne d'inspiration, la page d'accueil sélectionne les meilleures images générées par l'algorithme ainsi que la requête qui s'en accompagne. À savoir que ces images sont libre de droits, ce qui fait de DALL·E une excellente banque d'images.
Comment fonctionne DALL·E ? Du texte et un modèle
DALL·E est entraîné sur un jeu de données de paires texte-image. Pour chaque description textuelle, le modèle doit apprendre à générer une image correspondante. Les descriptions textuelles sont souvent des légendes simples, d'une seule phrase, comme « une photo en noir et blanc d'un zèbre ».
Au fil du temps, le modèle apprend à faire correspondre la sémantique des descriptions textuelles aux concepts visuels des images, et est capable de générer de nouvelles images à partir de descriptions textuelles inédites.
Créer des images avec DALL·E et le langage naturel
L'utilisateur décrit le sujet et le style de l'image qu'il souhaite obtenir et DALL·E utilise son apprentissage sur des millions d'images existantes pour créer ce qu'il estime correspondre à cette description. À l'heure actuelle, DALL·E ne prend en charge que l'anglais. Il faudra donc s'armer de la langue de Shakespear pour obtenir le résultat voulu.
À chaque requête, DALL·E va générer 4 images. C'est images seront toujours des carrés d'une résolution de 1024 par 1024 pixels qu'il sera possible de télécharger au format PNG. Vous êtes libres d'utilisés les images obtenus pour ce que vous voulez (blog personnel, marketing, etc).
Il est ensuite possible de retrouver toutes les images générées par ses requêtes dans l'onglet « My collection », bien qu'à l'heure actuelle, aucune option de tri ne soit disponible si ce n'est une classification « Favorites ».
DALL·E et la retouche d'image
DALL-E 2 peut également être utilisé pour éditer ou créer des variations de travaux existants. Une fonction récente appelée « outpainting » permet aux utilisateurs d'étendre une image au-delà de son cadre d'origine. Le matériel source peut aussi bien être une image que DALL·E vient de générer qu'un cliché issu de votre propre répertoire. Cet outil d'édition permet de retoucher l'image en question, en créer des variations, enlever ou ajouter des sujets, changer le fond, etc.
La génération de texte avec DALL
DALL n'est pas qu'un générateur d'images ! De part son utilisation de GPT-3, l'intelligence artificielle est également très douée pour la création de texte et bien d'autres tâches. Il est par exemple possible de lui demander de générer des questions pour une interview, d'analyser du code pour y trouver des erreurs ou tout simplement en décrire le fonctionnement. Plus impressionnant encore, l'algorithme peut transformer une requête en code fonctionnel et en temps réel.
Comment utiliser DALL·E ?
D'abord rendu disponible uniquement en bêta fermé pendant plusieurs mois, DALL est ouvert à tous depuis septembre 2022. Pour utiliser l'intelligence artificielle ou GPT-3 sur lequel la base de son algorithme s'appuie, il faudra se créer un compte. La création de compte peut être facilitée par l'authentification avec Google ou Microsoft. Dès la création du compte, DALL et son API vous seront rendus accessible.
Gratuit durant sa bêta fermé, le service d'OpenAI est désormais limité par un système de crédits. Les utilisateurs se voient octroyés 50 crédits à la création de leur compte et 15 crédits supplémentaires tous les mois. Au-delà, il faudra payer 15$ pour obtenir 115 crédits.
Pour l'instant, DALL E est uniquement accessible via sa plateforme web, mais des applications se basant sur l'API devraient sans doute voir le jour d'ici peu.
Quelles sont les alternatives à DALL·E ?
DALL a généré beaucoup de curiosité et de demande dès son lancement en bêta fermé. De ce fait, quelques solutions ont tenté de remplir le vide créé par l'absence d'accès au service d'OpenAI. Voici les plus prometteuses :
- Craiyon, qui se base sur l'API d'une version précédente de DALL
- Midjourney, un concurrent direct à DALL qui utilise également l'intelligence artificielle