Pourquoi utiliser Google Veo ?
Google Veo représente l'aboutissement de nombreuses années de recherche intensive menée par Google et sa filiale DeepMind dans le domaine de la génération vidéo par intelligence artificielle. En s'appuyant sur des projets précurseurs comme GQN, DVD-GAN, Imagen-Video ou encore Phenaki, les équipes de Google ont pu mettre au point un modèle d'une puissance inédite, capable de synthétiser des vidéos réalistes et cohérentes à partir de simples prompts textuels. L'annonce de Veo lors de la conférence Google I/O 2024 a créé l'événement, positionnant Google aux côtés d'OpenAI et de sa solution Sora dévoilée quelques mois plus tôt.
Veo vise haut
Veo possède la capacité à générer des vidéos en haute définition 1080p d'une durée pouvant dépasser la minute, là où la plupart des modèles concurrents plafonnent à 30 secondes en 720p. Cela ouvre de nouvelles possibilités créatives pour les réalisateurs et créateurs de contenu. Mais Veo brille surtout par sa compréhension fine du langage naturel et sa maîtrise des codes cinématographiques. Le modèle est capable d'interpréter des instructions complexes incluant des termes techniques propres au septième art (plans, mouvements de caméra, effets spéciaux...) pour produire exactement le rendu souhaité par l'utilisateur.De plus, Veo offre des options avancées d'édition permettant de modifier une vidéo générée ou importée : il est ainsi possible d'ajouter ou de retirer des éléments spécifiques dans une scène grâce à un système de masquage, ou encore de prolonger une séquence jusqu'à 60 secondes et au-delà en spécifiant l'action via des prompts.
Enfin, Veo se montre particulièrement performant pour maintenir la cohérence visuelle au fil des images. Là où de nombreux modèles génèrent des vidéos saccadées avec des éléments qui apparaissent et disparaissent de manière irréaliste, Veo s'appuie sur des transformers de diffusion latente de pointe pour assurer la stabilité des personnages et objets d'une frame à l'autre.
Une technologie éthique et responsable
Après la hype des premiers modèles de génération s'est posé la question des droits d'auteurs et du rapport des IA à ces derniers, sans parler des risques de détournement des contenus générés… Conscient des enjeux éthiques soulevés par une IA aussi puissante, Google a conçu Veo dans une optique de responsabilité. Toutes les vidéos générées sont ainsi marquées d'un filigrane invisible grâce à la technologie SynthID, permettant de les identifier comme des contenus synthétiques.Des filtres de sécurité et des processus de vérification de mémorisation sont également appliqués pour limiter les risques liés à la vie privée, aux droits d'auteur et aux biais. Google travaille en étroite collaboration avec des créateurs et cinéastes pour recueillir leurs retours et s'assurer que Veo bénéficie à l'ensemble de la communauté créative de manière éthique.
Comment utiliser Google Veo ?
Si Veo n'est pour l'instant accessible qu'à un groupe restreint de créateurs sélectionnés via la plateforme VideoFX, Google prévoit d'intégrer progressivement certaines fonctionnalités du modèle à ses autres produits comme YouTube Shorts. À terme, Veo a vocation à démocratiser la création vidéo en la mettant à la portée de tous.
Vous êtes intéressés pour l'essayer ? Il faudra passer par la case accès anticipé et s'inscrire sur la liste de Google. La firme de Mountain View n'a pour l'heure pas donné d'estimation sur le temps d'attente pour accéder à l'outil.
Quelles sont les alternatives à Google Veo ?
Si l'attente pour accéder à l'avant-première de Google Veo sur VideoFX vous semble trop longue, sachez qu'il existe d'autres options intéressantes pour expérimenter dès maintenant la génération vidéo par IA. Bien que ce domaine en soit encore à ses balbutiements, certains outils commencent à gagner en maturité et en popularité auprès des créateurs. C'est notamment le cas de Stable Video, une déclinaison du célèbre modèle Stable Diffusion spécialisée dans la synthèse vidéo. De son côté, Dream Studio propose une interface simple pour générer des clips à partir de textes et d'images. La startup Pika adopte approche axée sur la narration, permettant de créer facilement des histoires animées. Enfin, Runway fait figure de vétéran avec sa suite d'outils de création vidéo par IA, plébiscitée par de nombreux professionnels du secteur. Alors pourquoi ne pas les essayer en attendant de mettre la main sur Veo ?