Toujours plus réaliste, une "considérable avancée", la nouvelle IA Stable Diffusion arrive !

Publié le 25 juin 2023 à 19h00

Stable Diffusion est le modèle de génération d'images par apprentissage automatique proposé par l'entreprise Stable AI. Cette dernière vient d'annoncer la sortie de SDXL 0.9, la dernière version du logiciel.

Cette nouvelle version améliore nettement la qualité des images générées ainsi que leur composition. Le système de génération fonctionne à partir de prompts textuels, à la manière de DALL E 2. La version bêta diffusée en avril, Stable Diffusion XL, connaît déjà un succès très satisfaisant. SDXL 0.9 promet une amélioration massive du détail des résultats graphiques et une constitution globale optimisée par rapport à la version précédente.

Des innovations majeures dans la génération d'images

Alors que l'entreprise Midjourney propose un style artistique très distinctif, presque orienté vers le cartoon, SDXL 0.9 offre une génération d'images tendant un peu plus vers le réalisme, voire le photoréalisme. Ce parti pris lui permet de se démarquer plus facilement de ses concurrents et de présenter une variété de résultats plus ample.

Cette nouvelle version offre de nombreuses possibilités créatives : utilisation dans le cinéma ou la télévision, les clips musicaux, le design ou les vidéos pédagogiques. SDXL 0.9 dispose également de fonctionnalités avancées : création à partir d'une image existante en conservant l'harmonie (outpainting); génération de nouvelles images à partir d'images existantes (image-to-image prompting) ou reconstruction de parties d'images manquantes (inpainting). Ces fonctionnalités s'avèrent extrêmement intéressantes pour les créateurs graphiques, et permettent un gain de temps considérable sur de nombreux aspects de leur travail. Cependant, vous connaissez la rengaine : SDXL 0.9 ne remplace toujours pas la main de l'homme et sa sensibilité esthétique. Il est par contre un assistant créatif très efficace.

Les améliorations techniques de SDXL 0.9

Ce qui différencie la version bêta de la 0.9 est l'augmentation plus que significative de la quantité de paramètres d'entraînement sur lequel le modèle se repose. Celui-ci repose déjà sur un socle solide de 3,5 milliards de paramètres ; il faut rajouter à cela un pipeline d'ensembles de modèles composés de 6,6 milliards de paramètres différents. Du jamais vu !

Cela fait de SDXL 0.9 l'un des modèles en open source les plus complexes et riches jamais développés jusqu'à maintenant. Sa puissance de traitement s'appuie sur un des plus grands modèles d'OpenCLIP qui ait été entraîné aujourd'hui. Son gros avantage est qu'il peut être utilisé facilement sur un GPU grand public moderne : une NVIDIA de la série des 2XXX d'au moins 8 Go de VRAM (ou équivalent) lui suffira, ainsi que seulement 16 Go de RAM. Il tourne sans problème sur Windows 10, 11 ou même sur Linux. Dans ce dernier cas de figure, il faudra en revanche vous équiper d'un GPU d'au moins 16 Go de VRAM pour le faire fonctionner correctement.

Stability AI continue de faire grandir son bébé avec succès. Après le carton de la version bêta, celui-ci revient encore plus dopé en version 0.9. Tenez-vous prêts pour la sortie de la 1.0, qui arrive en juillet !

Sources : Engadget, Webcache

Vous êtes un utilisateur de Google Actualités ou de WhatsApp ?
Suivez-nous pour ne rien rater de l'actu tech !

Commentaires (10)

Stellvia

Ca donne quoi la nouvelle version est ce que ca se rapproche de mid journey ? Pour avoir testé l’ancienne version c’était vraiment à la traine par rapport a mid journey, j’en ai du mal a comprendre comment ca peut avoir du succès. Dans tout les cas c’est bien cette concurence c’est bon pour tout le monde.

a-snowboard

Justement ils disent qu’on est plus proche du photorealisme.

Perso ça m’intéresse et je vais tester

jvachez

Est-ce que ça sera mieux que ce que propose Photoshop en beta ?

crash3236

Je pense qu’une partie de son succès vient de sa dispo open source, de l’environnement Automatic 1111 et sa myriade de plugins qui permettent un niveau de contrôle incomparable (à ma connaissance), ainsi que la série de Fork de chaque modèles pour des taches bien particulières

Kriz4liD

Vous pouvez tester l ia via ce lien : dreamstudio.ai

gamez

Vous pouvez tester l ia via ce lien : dreamstudio.ai

merci

gamez

ah bah il faut acheter des crédits

Kriz4liD

Oui mais tu en reçois une 20ene quand tu t inscris.
C’est juste pour tester

AtomosF

Enfin une IA qui sait reproduire des mains qui n’ont pas 6 doigts et plus ?

Pronimo

J’espère que le produit quand il sortira comme SD que la licence est plus permissive, c’est culot quand meme de leur part surtout que leurs modèles sont créer en grande partie d’œuvres copyrightés…