midjourney

C’est en juillet 2022 que le laboratoire de recherche indépendant de David Holz a lancé la version bêta du programme Midjourney. Il s’agit d’un outil permettant de générer des images grâce à l’intelligence artificielle, à partir de descriptions textuelles. Midjourney est destiné, entre autres, aux personnes n’ayant pas de compétences particulières en graphisme, ainsi qu’à celles qui manquent de temps, de créativité ou de technique.

L’avènement de Midjourney, dans le sillage de DALL-E d’OpenAI, a été très rapide, puisqu’il en est aujourd’hui à la version 5, sortie le 15 mars 2023. C’est la raison pour laquelle son intérêt et son utilisation soulèvent encore de nombreuses interrogations. Suivez le guide pour en savoir plus sur cet outil qui a le vent en poupe !

Midjourney, c’est quoi ?

Midjourney est un programme de génération d’images à partir d’une intelligence artificielle qui analyse des mots-clés. Le système est basé sur le machine learning, avec un apprentissage automatique en continu, ce qui permet de fournir des résultats toujours meilleurs. Peu d’informations ont été dévoilées sur la technologie utilisée par Midjourney, mais l’entreprise se targue de prendre en compte des milliards de paramètres pour créer les images.

Le lancement de la version bêta de Midjourney n’a suivi que de quelques semaines celui de son concurrent DALL-E, édité par OpenAI, le concepteur de l’intelligence artificielle conversationnelle ChatGPT. Aujourd’hui, la version 5 de Midjourney propose davantage de styles et une qualité d’image améliorée. C’est avec cette version également qu’est arrivée la possibilité de choisir le ratio largeur/hauteur pour l’image générée, qui est carrée par défaut.

Midjourney ne fonctionne actuellement qu’en anglais, c’est-à-dire qu’il ne donne un résultat correct que pour les commandes passées dans cette langue. Le support d’utilisation est un bot Discord. Pour le moment, il n’existe pas d’interface Web plus ergonomique ni d’appli à installer, mais le développement serait en cours.

MidJourney

Que peut-on faire avec Midjourney ?

Midjourney peut être utilisé par les particuliers comme les professionnels et ses applications sont très nombreuses. Parmi elles, on peut retenir :

  • la mode (haute couture ou prêt-à-porter) ;
  • le concept design ;
  • la littérature (couvertures et illustrations de livres) ;
  • la réalité virtuelle (jeux vidéo et animation) ;
  • les campagnes de marketing ;
  • la publicité ;
  • le webdesign ;
  • l’architecture et la décoration ;
  • la presse (images réalistes et caricatures) ;
  • l’éducation…

Les images créées par Midjourney sont utilisables gratuitement dans le cadre d’un usage privé. Si vous souhaitez les exploiter dans un but commercial, vous devez avoir choisi l’une des versions payantes. 

Comment utiliser Midjourney ?

Midjourney n’est disponible que sur le serveur Discord dédié. Il est donc indispensable d’avoir un compte Discord pour commencer à générer des images. Discord peut être lancé depuis un navigateur ou via l’application. Le serveur Discord rassemble de nombreux salons (channels), dont certains spécifiquement destinés aux débutants.

Midjourney est-il gratuit ?

Il existe une version gratuite de Midjourney, le plan "free trial", avec des fonctionnalités réduites. Mais depuis le 29 mars 2023, pour faire face à une demande exponentielle, Midjourney a interrompu la mise à disposition de cette version. Aujourd’hui, il est indispensable de souscrire une offre payante pour générer des images.

L’offre basique est à 10 $ par mois, l’offre standard à 30 $ par mois et l’offre pro à 60 $ par mois. Les entreprises dont le chiffre d’affaires annuel dépasse un million de dollars sont obligées de souscrire l’offre "Pro". Avec un paiement annuel, les tarifs sont réduits de 20 %. Les différences entre les offres se situent au niveau du temps d’utilisation, du nombre de demandes simultanées ou en file d’attente, de l’accès au serveur rapide, de l’exécution en message privé… 

Midjourney, mode d’emploi

Dans la version gratuite de l’application ou au début de son utilisation avec un compte payant, il suffit de rejoindre l’un des salons #newbies-xx sur le serveur Discord. Pour les utilisateurs avancés, ce sont les channels #general-xx qui accueillent les commandes. Avec les offres payantes, il est possible, via l’invite /settings, de régler les paramétrages du compte Midjourney (version, qualité, style, mode public ou privé, mode rapide ou lent).

Mais ce n’est pas indispensable pour générer votre première image. Pour cela, il faut saisir dans l’un des salons une ligne de commande, qui se nomme un "prompt". Le prompt contient en premier lieu l’invite /imagine (vous demandez à l’IA d’imaginer une scène), suivie de la description du visuel à concevoir, en langage naturel. Quelques instants plus tard, la création est terminée et les 4 images générées sont affichées publiquement sur le salon. Pour que les images soient livrées en message privé, il faut avoir souscrit une version payante. Une fois les 4 images produites, il est possible d’en choisir une et de l’améliorer. 

Le fait que la génération se fasse publiquement peut être un inconvénient pour un usage professionnel, mais il permet de s’initier aux prompts en observant les demandes faites par les autres utilisateurs et les résultats obtenus.

Quelles sont les commandes disponibles dans Midjourney ?

Il existe une vingtaine d’invites de commande utilisables avec Midjourney. Les plus fréquentes sont : 

  • /settings pour régler les paramètres ;

  • /imagine pour introduire le prompt ;

  • /info pour tout savoir sur votre profil et connaître l’état des créations en cours.

D’autre part, il est possible d’appliquer des paramètres précis à chaque prompt, inscrits à la fin de la commande et précédés d’un double tiret. Par exemple, le paramètre --niji impose un style manga aux images générées, le paramètre --no permet d’exclure certaines choses de l’image (--no red enlève la couleur rouge), --ar indique le ratio à respecter, car par défaut les images sont carrées (--ar 16:9 pour une image en 16/9), etc. Tous les paramètres et les invites de commande sont disponibles sur le site de Midjourney. L’IA peut également s’inspirer d’une image existante, il suffit de lui spécifier dans le prompt l’URL à laquelle elle se trouve.

Ce que Midjourney ne peut pas faire

Certains contenus sont interdits dans les prompts. C’est le cas de ce qui est du domaine de l’ultra-violence ou de la pornographie, plus globalement des contenus "choquants ou dérangeants". Une attention particulière est portée également aux deepfakes, suite à des abus avec, entre autres, des photos de Donald Trump se faisant interpeller par les forces de l’ordre.

En mars 2023, l’utilisation du nom de Xi Jinping, président de la République populaire de Chine, a été interdite dans les prompts de Midjourney. Ce blocage pourrait permettre d’éviter des incidents diplomatiques, mais aussi une éventuelle censure totale de l’outil en Chine.

Les concurrents de Midjourney

Midjourney a suivi de peu son concurrent DALL-E, créé par OpenAI, l’éditeur de l’intelligence artificielle conversationnelle ChatGPT. Le fonctionnement est similaire, mais il est accessible directement en ligne, sans avoir à passer par un serveur Discord. Il est également possible d’installer une API pour un usage en dehors du site. Craiyon (DALL-E mini) est la version open source de son grand frère, proposée en mode gratuit (avec publicité) et sans limitation de crédits. Cette version est formée sur de plus petites quantités de données. Bing Image Creator, développé par Microsoft, est aussi un concurrent de Midjourney qui fonctionne avec des mots-clés. Stable Diffusion, quant à lui, est un générateur d’images open source qui est déjà implémenté sur plusieurs sites grâce à son API.

  • Droits commerciaux inclus dans tous les forfaits payants
  • Pertinence dans la compréhension des prompts
  • Tarifs accessibles
9 / 10