Après la génération de contenus comme les images, l'IA s'attaque petit à petit à la vidéo… et le résultat n'est pour l'instant pas concluant.
Une publicité devenue virale (créée par la société de production britannique Private Division à l'aide de la deuxième génération du modèle d'IA Runway) prouve en effet que le jour où de tels outils remplaceront les vidéastes de chair et d'os est encore loin d'être arrivé.
L'abus d'alcool est aussi dangereux pour l'IA
Si l'on est quand même déjà loin de l'une des premières et terrifiantes vidéos générées par l'IA (sortie le mois dernier) mettant en scène Will Smith en train de manger des spaghettis, il y a encore du pain sur la planche pour arriver à un résultat crédible.
Une nouvelle production assistée en ce sens, baptisée Synthetic Summer et publiée d'abord sur Instagram, est devenue virale. Elle se veut une publicité pour de la bière, imaginée par l'intelligence artificielle. Cette vision des enfers a fait rire beaucoup d'internautes et… la vidéo est clairement plus parlante que des mots.
Pour arriver à ce résultat cauchemardesque, Private Island s'est servi de la deuxième génération du modèle IA Runway. Celui-ci est encore en phase de test fermé et est alimenté par des millions d'images et clips vidéo. La société de production britannique a ainsi généré plusieurs clips à partir d'un texte, et constitué en quelque sorte un best-of des « meilleures propositions » de Runway pour en arriver à cette vidéo d'une trentaine de secondes.
L'humain encore indispensable ?
Même si la vidéo est principalement générée par l'intelligence artificielle, l'intervention de l'humain est encore nécessaire. Tout d'abord, comme pour les générateurs d'images tels que DALL-E ou Midjourney, l'IA a besoin d'instructions précises. Ensuite, même avec la meilleure description du monde, il faut faire le tri entre les différents clips produits, dont certains sont visiblement impropres à l'œil humain sans en brûler la rétine.
Un autre exemple de publicité générée à l'aide de l'IA nous le prouve. Baptisée Pizza Later, la vidéo a demandé à son créateur trois heures de travail avec Runway, mais également GPT-4 pour le script, Midjourney pour des images fixes et Eleven Labs pour la voix-off. Un assemblage « potable » a ensuite été compilé sur Adobe After Effects… pour un résultat encore d'un autre monde.
En attendant que l'IA connaisse une évolution aussi fulgurante dans la génération de vidéos que dans d'autres domaines, elle ne risque pas, au vu des derniers résultats, de remplacer l'être humain de sitôt. Il faut bien essayer de voir le verre (de bière) à moitié plein.
Sources : Privateisland.tv, Pizza Later sur YouTube
20 décembre 2024 à 19h02