Pourquoi utiliser Sora ?

Sora est un outil de l'entreprise dédiée à l'intelligence artificielle OpenAi, dont le but est de générer des vidéos réalistes capables de durer jusqu'à une minute. Sora rejoint ainsi l'IA générative dédiée au texte ChatGPT et l'IA générative dédiée aux images Dall-E, en franchissant un domaine jusqu'alors compliqué à accéder : la vidéo. L'idée est donc dans l'ensemble la même que pour les deux outils déjà bien établis d'OpenAi : il suffit d'inscrire un prompt textuel sur la plateforme, pour que cette dernière emploie les informations reçues pour créer une vidéo. On appelle ça du « text-to-video », une considération jusqu'ici restée dans le domaine de la fiction.

Pour le moment, les productions proposées par Sora sont plutôt brèves, et ne peuvent pas dépasser les 60 secondes. OpenAI le mentionne bien sur X, lors de la révélation de son projet : « Les vidéos de Sora peuvent atteindre une durée maximale de 60 secondes en présentant des scènes très détaillées, des mouvements de caméra complexes et plusieurs personnages aux émotions vibrantes ».

Sora est capable de créer des vidéos en quelques secondes © Capture Clubic - OpenAI

Avec cet outil, il est donc possible de créer de courtes bandes annonces. OpenAI a pu démontrer l'efficacité de son outil avec ce prompt : « Un trailer de film montrant les aventures d'un homme de 30 ans dans l'espace, portant un casque de motard entouré de laine rouge, avec un ciel bleu, un désert salé, le tout avec un style cinématique, tourné en 35mm et des couleurs vibrantes ». Le résultat permet ainsi de constater, à travers une courte vidéo de 17 secondes, que tous les éléments donnés dans le prompt sont respectés, le tout avec un réalisme total. Sora emploie en effet diverses techniques pour offrir une consistance dans les vidéos proposées, avec des mouvements de caméra dynamiques, une compréhension de la 3D, une cohérence à longue portée et une permanence des objets (le modèle peut ainsi conserver les personnes, animaux et objets même lorsqu'ils sont masqués ou absents du cadre).

Un réalisme inédit pour de l'IA générative © Capture Clubic - OpenAI

Il est par ailleurs important de mentionner que générer des vidéos n'est pas le seul attrait de Sora. L'outil d'OpenAI peut par ailleurs récupérer des photos générées par Dall-E pour ensuite les animer. D'autre part, l'outil d'intelligence artificielle peut modifier des vidéos déjà existantes pour les allonger dans le temps. Si par exemple vous capturez en vidéo un joueur de football avant qu'il ne fasse une passe, Sora pourra ainsi déterminer la suite des événements et les retranscrire en vidéo grâce à l'intelligence artificielle générative. C'est également un outil pratique lors du montage de vidéos : Sora peut être employé pour graduellement lier deux vidéos entre elles, afin de créer des transitions logiques.

Comment utiliser Sora ?

Pour le moment, il n'est pas encore possible d'utiliser Sora. OpenAI a ainsi mentionné que Sora n'est pas intégré à ses services déjà accessibles auprès du grand public : principalement dédié à un usage interne, le but actuel de l'entreprise est de jauger les risques potentiels d'une telle technologie. Pour l'heure, aucune date de mise à disposition du service n'a encore été communiquée par OpenAI.

Quant au modèle potentiellement employé par Sora à l'avenir, il pourrait reprendre celui déjà utilisé par ChatGPT ou Dall-E : accessible gratuitement pour une utilisation simple, et la possibilité de s'abonner afin de profiter de fonctionnalités supplémentaires. OpenAI pourrait par ailleurs proposer un modèle économique fermé, sans version gratuite.

L'utilisation de Sora repose par ailleurs sur le « text-to-video », à l'inverse du « video-to-text » principalement employé afin de générer des sous-titres par exemple. Pour l'utilisation, l'idée est donc la même que pour ChatGPT ou Dall-E : l'utilisateur inscrit un prompt écrit dans la plateforme, lui indiquant tous les paramètres qu'il souhaite voir apparaître dans sa vidéo. Sora compile ces informations puis génère artificiellement une courte vidéo (jusqu'à 1 minute) basée sur les données récupérées dans le prompt. Cela permettra donc à terme à de nombreuses personnes de générer eux-mêmes un rapide film en fonction des idées qui leur passent par la tête.

Des vidéos générées à partir d'un simple texte © Capture Clubic - OpenAI

Quelles alternatives à Sora ?

Puisque Sora se repose entièrement sur de nouvelles technologies et une appréciation inédite de l'intelligence artificielle générative, il n'existe encore pas à l'heure actuelle d'outil offrant une telle précision dans les rendus vidéos proposés. Cependant, des services comme Fliki, Gen-2 ou Synthesia partent tous du même principe (« text-to-video »), mais à un degré de réalisme et d'efficacité moindre.