Google a présenté la nouvelle version de son générateur de vidéos par intelligence artificielle. Les premiers clips partagés montrent une nette augmentation dans la quantité de détails et des images presque photoréalistes.

Ce chien et cette bouée n'existent pas mais générés par Google Veo 2 © Google
Ce chien et cette bouée n'existent pas mais générés par Google Veo 2 © Google

La génération de vidéos par intelligence artificielle n'est plus une lubie des géants de la tech. Depuis la présentation de Sora, l'outil conçu par OpenAI, la réalisation de vidéos entièrement générées par ordinateur de manière automatique est une réalité, et les résultats sont de plus en plus impressionnants. Si les premiers clips générés par des prompts étaient perclus de bugs et d'autres bizarreries, l'outil d'intelligence artificielle apprend vite, très vite même, et les clips vidéos de quelques secondes peuvent tromper les yeux du grand public, comme des professionnels. Google, lui aussi très investi dans le domaine de l'IA, n'a pas regardé le train passer et a rapidement présenté son propre outil, Veo, qui se décline aujourd'hui dans une version mise à jour et remplie de nouveautés.

Des clips photoréalistes, avec encore plus de détails à l'écran

Pour présenter les améliorations apportées à Veo 2, Google a publié différents petits clips, montrant les différents types de vidéos réalisables via l'outil d'intelligence artificielle. Comme on peut le voir, Veo 2 peut à la fois réaliser des vidéos hyper réalistes comme des petits cartoons en 3D, dont le style visuel se rapproche fortement de celui des studios Pixar.

Pour cette deuxième version, les équipes de Deepmind, la branche de Google dédiée à la recherche en matière d'intelligence artificielle, ont concentré leurs efforts sur l'animation et le réalisme des animations faciales, ainsi des mouvements des êtres humains. Les expressions sont ainsi plus naturelles et la physique est respectée pour éviter d'être confronté à la vallée de l'étrange, ce sentiment qui nous met mal à l'aise devant des reproductions humaines dont on perçoit les petits défauts.

Un look plus cinéma et sans hallucinations pour des vidéos prêtes à l'emploi

Google Veo 2 est également plus intéressant d'un point de vue artistique. Les développeurs ont travaillé l'esthétique des clips vidéos, afin de choisir la focale désirée ou le type d'objectif de caméra. Le but est de rendre plus cinématographique la vidéo produite par IA, pour une utilisation à destination d'une publicité ou d'une vidéo institutionnelle.

Veo 2 a été enfin amélioré pour éliminer les « hallucinations », telles que les mains à six doigts ou encore les visages déformés. Les vidéos peuvent maintenant durer plusieurs minutes et l'outil peut générer des clips en 4K pour les monteurs vidéo souhaitant réaliser des projets en ultra haute-définition. Google indique en outre qu'un watermark invisible est inclus à chaque clip afin de repérer ces clips

Le projet Veo 2 est disponible pour les membres de Google Labs VideoFX, mais les utilisateurs américains peuvent s'inscrire à une liste d'attente dans le but de tester l'outil pour réaliser un clip d'une minute. Nul doute qu'avec le lancement de Sora chez OpenAi, Veo 2 devrait rapidement être disponible à davantage d'utilisateurs dans les prochains mois.