- Droits commerciaux inclus dans tous les forfaits payants
- Pertinence dans la compréhension des prompts
- Tarifs accessibles
- Ergonomique et intuitif
- Comprend le langage naturel
- Comprend le français
Tarifs, ergonomie, fonctions avancées, rendu… Nous vous proposons un tour d’horizon des qualités et des défauts de chacune des deux IA, afin de déterminer laquelle gagne nos faveurs. Avec, en prime, un test de 5 prompts en conditions réelles. C’est parti pour notre dossier comparatif DALL·E 3 vs Midjourney !
DALL·E 3, en bref
Lancé le 5 janvier 2021, DALL·E est le pionnier en matière dintelligence artificielle génératrice d’images. Il a été développé par OpenAI, qui est également à l’origine du célèbre ChatGPT, intelligence artificielle conversationnelle. DALL·E 3 est la version actuellement disponible.
Il n’est pas nécessaire d’installer quoi que ce soit pour utiliser DALL·E 3, vous pouvez vous servir de n’importe quel navigateur pour vous connecter à votre compte OpenAI (obligatoire). Celui-ci donne accès à DALL·E 3, mais aussi à ChatGPT 4. Comme ce dernier, DALL·E 3 comprend le langage naturel. Il suffit, dans le champ de saisie, de décrire de façon détaillée l’image que l’on souhaite produire : sujet, environnement, luminosité, format, style…
Jusqu’à l’automne 2023, DALL·E 3 créait quatre visuels pour un seul prompt. Désormais, il n’en génère que deux à la fois. Et si les serveurs sont saturés, il peut arriver exceptionnellement qu’il n’en propose qu’un. Lorsque la génération est terminée, vous pouvez voir les images en gros plan et les télécharger. Il est possible de les télécharger également (en résolution maximale) sans même les agrandir. Vous souhaitez une nouvelle génération d’images d’après le même prompt ? C’est faisable en un clic.
Midjourney, en bref
Midjourney est apparu bien après DALL·E 3, puisque sa version bêta est sortie en juillet 2022. Contrairement à DALL·E, Midjourney n’est pas disponible directement depuis un navigateur. Cette IA est en réalité un robot qui fonctionne sur un serveur Discord. Il faut donc, pour l’utiliser, avoir un compte Midjourney et un compte Discord. Il n’existe pas d’interface dédiée.
Midjourney comprend également le langage naturel, mais il est plus à l’aise avec des mots-clés qu’avec des phrases construites. Comme pour son concurrent, c’est dans le prompt que vous pouvez indiquer tout ce qui va composer l’image. Pour que Midjourney sache que vous lui demandez la génération d’une image, le prompt doit impérativement commencer par l’invite /imagine.
L’IA génère alors 4 images. Si vous souhaitez en télécharger une en format supérieur, vous devez effectuer un « Upscale » en utilisant le bouton prévu à cet effet. Et comme pour DALL·E 3, vous pouvez demander une nouvelle génération de 4 images à partir du même prompt.
DALL·E 3 et Midjourney, le match
Le tarif : égalité
Comme toutes les intelligences artificielles génératrices d’images, DALL·E 3 et Midjourney ont finalement supprimé l’accès aux offres gratuites sans limitation de fonctionnalités.
Cependant, il est possible d’utiliser le moteur de DALL·E 3 gratuitement avec Bing Chat et Bing Image Creator, à condition d’avoir un compte Microsoft. Toutes les fonctionnalités, particulièrement celles qui impliquent d’uploader vos propres fichiers, ne sont pas disponibles via cette interface, mais vous pouvez quand même profiter de la puissance de DALL·E 3 sans débourser un centime. Cet accès gratuit compense le fait que le tarif de l’abonnement à ChatGPT Plus, qui inclut DALL·E 3, soit à 20 dollars par mois, hors taxes, avec une limite de 40 images générées toutes les 4 heures.
Midjourney n’a plus aucune offre gratuite, mais le tarif mensuel de l’abonnement de base est de 8 dollars par mois hors taxes (avec paiement annuel) ou 10 dollars par mois hors taxes (avec paiement mensuel). L’abonnement à Midjourney fonctionne sur un système de temps de génération. Avec un abonnement de base, vous avez droit à 3,3 heures mensuelles, soit environ 200 générations d’images. On apprécie la possibilité d’acheter du « temps » supplémentaire, à 4 dollars l’heure, à condition d’avoir une offre payante en cours.
L’ergonomie : avantage DALL·E 3
Pour se servir de Midjourney, il est impératif d’avoir un compte Midjourney et un compte Discord. Même si ce système de messagerie instantanée est plutôt intuitif, il impose une prise en main spécifique. Ensuite, l’utilisation du robot lui-même n’est pas complexe non plus, mais ici encore, elle demande un petit apprentissage pour savoir rédiger un prompt et, de façon facultative, recourir aux paramètres de l’IA. Avec DALL·E 3, rien de tout ça. Il est disponible directement depuis un navigateur. Rien à assimiler de particulier, il suffit d’écrire son instruction dans le champ de saisie, en langage naturel.
Autre avantage de DALL·E 3 : il comprend très bien le français. Il est possible d’utiliser le français dans Midjourney également, mais les résultats, surtout sur les prompts complexes, peuvent être décevants en comparaison de ceux obtenus avec l’anglais. Et comme DALL·E 3 « parle » un langage naturel, vous pouvez lui donner des directives pour modifier les images qu’il vient de générer, pas besoin de reprendre le prompt depuis le début.
Enfin, lorsqu’une image vous convient parmi celles générées par Midjourney, vous devez passer par le mode « Upscale » pour pouvoir l’enregistrer en bonne résolution. Dans DALL·E 3, l’enregistrement peut se faire sans agrandissement préalable, directement depuis l’aperçu des visuels.
Les fonctions bonus : avantage Midjourney
On peut dire que DALL·E 3 a les défauts de ses qualités. Il est ergonomique et intuitif. Mais il passe de ce fait à côté de fonctionnalités avancées que l’on trouve chez Midjourney. Les paramètres, pour commencer, permettent de peaufiner un prompt (ratio, qualité…) ou d’enregistrer ses réglages favoris/récurrents. Avec les multiprompts, vous pouvez pondérer les éléments du prompt et accorder plus d’importance à l’un ou à l’autre. Les permutations, quant à elles, donnent la possibilité d’interchanger certaines parties du prompt pour générer autant d’images que de combinaisons possibles. Par exemple, pour la photo d’une voiture, vous pouvez générer autant de photos que les couleurs que vous avez préparamétrées pour sa carrosserie.
Midjourney et DALL·E 3 sont en revanche à égalité quant au fait d’uploader ses propres photos, pour en générer de nouvelles ou pour en extraire un prompt réutilisable.
Le rendu : avantage Midjourney
La résolution : avantage Midjourney
Par défaut, les images générées par Midjourney sont au format 1024 x 1024 pixels. C’est le cas également avec DALL·E 3. Mais avec Midjourney et l’outil « Upscale », vous pouvez atteindre 2048 x 2048 pixels (Upscale 2x), voire 4096 x 4096 pixels (Upscale 4x). DALL·E 3, quant à lui, permet de forcer la taille des images à 1024 x 1792 pixels ou 1792 x 1024 pixels, pas plus.
En revanche, les deux IA sont à égalité quant à la possibilité de jouer avec le ratio de l’image : 2:3, 3:2, 16:9…
Le réalisme : avantage Midjourney
Les deux AI permettent, en maniant correctement les prompts adaptés, de produire des photos bluffantes parfois. Mais le point va ici définitivement à Midjourney. D’abord avec l’instruction « photo réaliste » qui, dans DALL·E 3, vous garantit un résultat tout sauf réaliste… C’est le prompt « photo naturelle et amateur » qui permet d’obtenir des photos un tant soit peu vraisemblables, mais souvent encore un peu « cireuses ». Avec un peu d’entraînement et en multipliant les générations, on peut arriver à un résultat potable, mais Midjourney l’atteint plus rapidement et de façon plus intuitive.
- Une femme avec le crâne rasé qui porte des lunettes noires, un peu dodue, travaille sur son ordinateur portable. La photo est réaliste et extrêmement détaillée, elle pourrait gagner un prix. La lumière est artificielle.
- a shaved hair lady with black glasses, a little chubby, working on her laptop, realistic photo, award-winning photo, artificial light, highly detailed
Les faits : 5 prompts au banc d’essai
- Une photo réaliste, à lumière du soleil, d’une chaise en bois marron dans un jardin fleuri
- a brown wooden chair in a garden full of flowers, realistic photo, sunlight
- Une femme blonde aux yeux bleus, assise près d’une fenêtre
- a blond woman with blue eyes, sitting next to a window
- a bouquet of red tulips in a transparent vase, oil painting
- Une peinture à l’huile d’un bouquet de tulipes rouges dans un vase transparent
- a coloring book page of a black and white turtle, cartoon style, bold lines
- Une page de livre de coloriage représentant une tortue en noir et blanc, en style bande dessinée et avec des traits gras
- a tree next to a huge rock, japanese ink art
- Un dessin d’art japonais à l’encre, représentant un arbre à côté d’un énorme rocher
DALL·E 3 vs Midjourney, le verdict
Même si, au comptage des points, Midjourney remporte haut la main ce match, DALL·E 3 n’a pas à rougir de ses performances. Il est bien plus intuitif et ergonomique et, surtout, il est utilisable par les personnes non anglophones sans perte de qualité. Le fait qu’il soit disponible gratuitement, dans ses principales fonctionnalités, est également un atout de taille. Malgré tout, le rendu final, ainsi que les outils avancés de Midjourney en font un concurrent redoutable, capable de générer des images d’une qualité exceptionnelle, malgré le temps de prise en main et d’adaptation.
- Droits commerciaux inclus dans tous les forfaits payants
- Pertinence dans la compréhension des prompts
- Tarifs accessibles
- Ergonomique et intuitif
- Comprend le langage naturel
- Comprend le français