Gemini va se mettre à la page pour ce qui est de la génération d'images © Shutterstock
Gemini va se mettre à la page pour ce qui est de la génération d'images © Shutterstock

Gemini, l'intelligence artificielle de Google, franchira bientôt une nouvelle étape dans la création d'images. L'assistant virtuel du géant de la technologie s'apprête à offrir davantage de contrôle aux utilisateurs sur leurs créations visuelles générées par IA.

Récemment, Google a annoncé le passage de Gemini 1.0 à Gemini 1.5 Flash, une version plus rapide et efficace de son assistant IA. Mais ce n'est visiblement pas tout. De récents indices font état de l'arrivée prochaine d'un nouvel outil permettant d'ajuster les images générées par IA après leur création.

Gemini : vous pourrez bientôt modifier vos images à l'aide d'invites textuelles

La dernière version bêta de l'application Google pour Android (version 15.29.34.29) révèle l'arrivée imminente d'outils permettant d'affiner les images générées par Gemini. Cette fonctionnalité s'annonce particulièrement utile, notamment dans les situations où l'image créée est globalement satisfaisante, mais qu'elle nécessite encore quelques ajustements.


Actuellement, Gemini ne propose aucun moyen de modifier une image une fois celle-ci générée. Les utilisateurs sont alors contraints de relancer le processus avec de nouvelles descriptions, ce qui peut bien souvent s'avérer chronophage. La nouvelle fonction d'affinage permettra de conserver l'essence de l'image tout en modifiant certains éléments spécifiques grâce à des instructions textuelles. Par exemple, un utilisateur pourra demander à Gemini de « changer la couleur de la voiture en rouge » sans avoir à régénérer l'intégralité de l'image.

Une fonction d'édition par sélection manuelle ?

En plus des invites textuelles, Gemini offrira une méthode d'édition encore plus intuitive sur les appareils dotés d'écran tactile. Les utilisateurs pourront directement encercler du doigt (ou avec un stylet sur les appareils compatibles) la zone de l'image qu'ils souhaitent modifier. Il suffira ensuite d'indiquer au chatbot les changements désirés, sans avoir à décrire précisément la partie de l'image. L'assistant comprendra alors que les retouches demandées ne concernent que la zone sélectionnée, préservant ainsi le reste de l'image de toutes modifications.


Bien que ces fonctionnalités aient été repérées dans le code de l'application, elles ne sont pas encore opérationnelles à l'heure où nous écrivons ces lignes. Il est probable que Google effectue encore des ajustements côté serveur avant de les activer pour le grand public. Néanmoins, cette découverte laisse présager une évolution intéressante dans la manière dont les utilisateurs pourront interagir avec les images générées par Gemini.

  • Un modèle de génération puissant
  • Une base de connaissances actualisée en temps réel
  • Gratuit et intégré à l'écosystème Google
8 / 10

Source : Neowin