Alors que Sora d'OpenAI se fait attendre, Google dévoile son arme secrète avec Veo, un modèle capable de créer des vidéos HD à partir de simples descriptions textuelles. Disponible en avant-première sur Vertex AI, cette technologie promet de révolutionner la création de contenu vidéo pour les professionnels.

Vidéo d'un voilier, générée avec Veo. © Google
Vidéo d'un voilier, générée avec Veo. © Google

La course à l'innovation dans le domaine de la génération vidéo par intelligence artificielle s'intensifie. Google vient d'annoncer la disponibilité en avant-première privée de Veo, son modèle de génération vidéo le plus sophistiqué, sur sa plateforme cloud Vertex AI.

Une technologie de pointe aux capacités impressionnantes

Dévoilé lors du Google I/O plus tôt cette année, Veo peut produire des vidéos en haute définition 1080p, avec un taux de 24 à 30 images par seconde. Le modèle peut générer des séquences de six secondes à partir de simples descriptions textuelles ou d'images de référence, en maintenant une cohérence visuelle remarquable tout au long de la vidéo.

L'outil maîtrise différents styles cinématographiques et comprend parfaitement le vocabulaire technique du cinéma, permettant la création de time-lapse ou de prises de vue aériennes. Les utilisateurs peuvent également modifier des vidéos existantes grâce à des fonctionnalités d'édition avancées et simuler des effets physiques basiques.

Un déploiement stratégique et contrôlé

Parmi les premiers utilisateurs, on trouve des acteurs majeurs comme Quora, qui intégrera Veo à sa plateforme de chatbot Poe, et Mondelez International, propriétaire d'Oreo, qui l'utilisera pour créer du contenu marketing. Cette approche sélective permet à Google de tester son outil dans des conditions réelles d'utilisation professionnelle.

Une autre vidéo générée par Veo. © Google

Google a mis en place plusieurs garde-fous, notamment des filtres au niveau des prompts et une politique d'indemnisation pour protéger les utilisateurs contre d'éventuelles accusations de violation de droits d'auteur. Chaque contenu généré est également marqué invisiblement grâce à la technologie SynthID, une mesure essentielle pour lutter contre la désinformation.

L'arrivée de Veo s'inscrit dans un contexte hautement compétitif. OpenAI avec Sora, Meta avec MovieGen, et Amazon avec ses outils de génération vidéo pour publicitaires, tous cherchent à s'imposer sur ce marché prometteur. Cette émulation pousse les entreprises à innover constamment tout en soulevant des questions éthiques importantes.

Les équipes de Google et Donald Glover dans un clip promotionnel pour Veo. © Google

La récente controverse autour de Sora d'OpenAI, où des artistes-testeurs ont protesté contre ce qu'ils considèrent comme de l'« art washing », illustre les tensions croissantes entre innovation technologique et respect du travail créatif. Google semble avoir tiré les leçons de ces expériences en adoptant une approche plus mesurée et transparente, notamment en collaborant avec la star américaine Donald Glover pour la promotion de l'outil.

Source : Venturebeat