Google Bard sur smartphone © Shutterstock
Google Bard sur smartphone © Shutterstock

Google Bard devrait très bientôt se doter d'un générateur d'images.

Google continue ses efforts pour développer Bard. On sait déjà que l'agent conversationnel va gagner de nombreuses fonctionnalités dans les semaines à venir, et l'on ne devrait pas attendre bien longtemps avant de voir débarquer un générateur d'images.

Bard complète sa panoplie

Comme le souligne Dylan Roussel, un développeur d'applications Android, sur X.com, Google prévoit une mise à jour de Bard pour ce 18 janvier 2024. Il a en tout cas repéré un patch notes, pas encore officiellement publié, daté de ce jour. Celui-ci indique comme nouveauté la possibilité de créer des images avec Bard.

« C'est facile à utiliser : tapez simplement quelques mots pour que ce que vous imaginez devienne réalité », peut-on lire sur le document. L'outil permet de générer plusieurs visuels à partir du même prompt et de télécharger les images ainsi créées.

Il est également précisé que dans un premier temps, cette fonctionnalité est réservée aux invites en anglais. On ne sait par contre pas si une limitation géographique ou au niveau du compte Google sera mise en place.

Des images réalistes et fidèles aux invites

Le générateur d'images de Bard est basé sur la technologie Imagen 2, qui permet de convertir des commandes sous forme de texte en image. Google promet des résultats « photoréalistes de haute qualité […] et cohérents avec les invites de l'utilisateur ».

L'un des objectifs de Google a été d'améliorer le rendu des mains et des visages humains et de générer des images exemptes d'artefacts visuels gênants, deux points sur lesquels les IA génératives d'images ont encore des problèmes.

Des images générées par Imagen 2 © Google
Des images générées par Imagen 2 © Google

La firme de Mountain View explique qu'Imagen 2 a été entraîné à partir des détails des images et des légendes associées qui lui sont soumises. « Pour aider à créer des images de meilleure qualité et plus précises, qui correspondent mieux à l'invite de l'utilisateur, une description plus détaillée a été ajoutée aux légendes des images dans l'ensemble de données de formation », fait savoir Google.

Grâce aux associations entre images et légendes, le modèle est capable de mieux comprendre la relation entre les images et les mots, « augmentant ainsi sa compréhension du contexte et des nuances ».

  • Un modèle de génération puissant
  • Une base de connaissances actualisée en temps réel
  • Gratuit et intégré à l'écosystème Google
8 / 10