© Clubic
© Clubic

L'avènement des intelligences artificielles, avec ChatGPT en tête, amène son lot de questions. Est-ce que cet outil restera un outil comme l'a été l'ordinateur en son temps, ou est-ce un destructeur d'emplois ? Dans tous les cas, de jour en jour, nous découvrons de nouveaux domaines dans lesquels il peut être compétent.

Aujourd'hui, c'est sa capacité à accompagner dans l'utilisation d'autres IA qui nous intéresse. Passons donc en revue sa manière de créer des prompts pour DALL-E.

ChatGPT est-il imaginatif ?

Tout d'abord, nous allons commencer par tester les capacités de « création » du chatbot ChatGPT. Il faut également vérifier s'il est en mesure de faire la tâche que nous voulons lui confier. Par avance, nous savons déjà qu'il nous répondra par l'affirmative si nous lui demandons quelle est son aptitude à générer des prompts pour DALL-E.

© Maximilien Herr pour Clubic
© Maximilien Herr pour Clubic

On remarque donc qu'il est bien en mesure de réaliser la tâche, et qu'il a même pris l'initiative de faire des propositions. Il suggère ainsi plusieurs prompts pour DALL-E. Toutefois, ceux-ci sont peu précis, ce qui donne des résultats très hétéroclites. Comme vous pouvez le voir ci-dessous, les images sont dans des styles très variés, ce qui était attendu.

© Maximilien Herr pour Clubic

Guider ChatGPT, telle est ta mission

Comme toujours, ChatGPT a besoin d'informations précises pour exceller dans ses réponses. Ainsi, sa capacité créative pure est très limitée, il pourra plutôt perfectionner nos envies. Nous allons donc plutôt nous orienter vers une création humaine, une idée à nous. Il devra ainsi synthétiser l'idée et faire en sorte que le prompt soit orienté pour obtenir les bons résultats. L'idée que nous avons aujourd'hui : créer une image qui représente un ensemble de produits technologiques (smartphone, PC, tablette, écouteurs, montre connectée…).

© Maximilien Herr pour Clubic

On retrouve donc un prompt très précis, mais long. Ne perdons pas plus de temps et voyons ce que cela donne du côté de DALL-E. Sur les propositions que vous pouvez voir ci-dessous, les éléments réclamés sont bien retrouvés, le style de l'image est respecté. Toutefois, il y a dans la génération quelques bugs liés à DALL-E. Ce que nous avions en tête, ce n'était pas une photo vue du dessus. Et nous insistons sur le fait que l'on doit voir des écouteurs sans fil, une montre connectée, un PC, un smartphone avec un écran sans bordures et une tablette.

© Maximilien Herr pour Clubic

Nous demandons donc simplement à ChatGPT de modifier ce prompt en précisant notre pensée. Au passage, nous réalisons qu'il serait pertinent de tester cela en anglais, pour voir la différence de réaction. Nous précisons par ailleurs à ChatGPT d'être descriptif et de ne pas demander l'image.

© Maximilien Herr pour Clubic

Finalement, nous obtenons des résultats plus proches de ce que nous avions en tête, et d'une très bonne qualité. La première image est d'ailleurs excellente, elle sera la base pour la suite de l'expérimentation.

© Maximilien Herr pour Clubic

Étendre une image, c'est possible avec DALL-E

Les images carrées, c'est bien pour Instagram, mais inutile pour tout le reste d'Internet. Nous allons donc utiliser une fonctionnalité de DALL-E qui permet d'étendre une image. On peut soit demander une extension basique, soit carrément ajouter des éléments spécifiques. Il est également possible grâce à cela de fusionner des images.

© Maximilien Herr pour Clubic

Sur l'exemple ci-dessus, il s'agit simplement de la poursuite de l'image, avec exactement le même prompt. On obtient un résultat plus complet et plus facile à exploiter grâce à un format rectangulaire. Toutefois, sur l'image originelle, il manquait des éléments. Nous pouvons donc utiliser un prompt particulier pour choisir de mettre à jour l'image selon ce que nous souhaitons.

© Maximilien Herr pour Clubic

Remarquons que ChatGPT a du mal à se contenter d'une description simple. Nous disposons de la version 3.5, mais peut-être que la version 4, disponible en version payante, serait plus efficace. Toutefois, le résultat sur DALL-E n'est pas mauvais du tout. Nous avons réalisé le prompt des deux côtés, en séparant la tablette à droite et l'ordinateur à gauche, et à quelques défauts près, le résultat final est presque exploitable.

© Maximilien Herr pour Clubic

Pour aller plus loin …

Il est réellement possible de créer plein de choses : une photo de profil pour ses réseaux sociaux, une miniature de vidéo YouTube, etc. Toutefois, le parcours de cet article peut vous donner des astuces et des idées pour créer vos propres images.

Nous avons pu remarquer plusieurs petits soucis. En effet, l'image générée a parfois de petits bugs de « collisions » entre les objets. Cela peut être réglé en retirant ces bugs et en demandant une nouvelle génération. Mais concrètement, ChatGPT nous a été d'une grande aide !

  • Chat dans différentes langues, dont le français
  • Générer, traduire et obtenir un résumé de texte
  • Générer, optimiser et corriger du code
10 / 10