Dans une annonce qui marque un tournant décisif pour l'industrie créative, OpenAI dévoile la version commerciale de Sora, son outil de génération vidéo par intelligence artificielle. Cette technologie, qui transforme le texte en séquences vidéo d'un réalisme saisissant, soulève autant d'enthousiasme que de questionnements éthiques.

Un plan cinématique en drone d'un phare généré avec Sora. © OpenAI
Un plan cinématique en drone d'un phare généré avec Sora. © OpenAI

Après plusieurs mois d'attente et de tests en accès restreint, OpenAI déploie enfin Sora, son modèle de génération vidéo par intelligence artificielle, dans le cadre de son événement « Shipmas ». Cette technologie promet de métamorphoser la création de contenu vidéo en permettant de générer des séquences à partir de simples descriptions textuelles, ouvrant ainsi la voie à de nouvelles possibilités créatives.

Sora
  • Génération vidéo rapide et réaliste
  • Interface utilisateur intuitive
  • Intégration avec ChatGPT

Une accessibilité encadrée par des abonnements

Envie de créer vos propres vidéos par IA ? Sortez votre carte bleue. OpenAI propose deux formules : l'abonnement ChatGPT Plus à 20 dollars mensuels vous donne droit à 50 vidéos en 720p de 5 secondes. Pour les plus ambitieux, le forfait Pro à 200 dollars, dévoilé il y a quelques jours, débloque la haute définition 1080p, des séquences de 20 secondes et un généreux quota de 500 vidéos mensuelles. Un positionnement premium qui traduit la volonté d'OpenAI de cibler en priorité les professionnels.

Sora ne demande pas d'abonnement exclusif, mais s'intègre dans les offres « Plus » et « Pro » de ChatGPT. © OpenAI

Là où Sora tire son épingle du jeu face aux nombreux concurrents qui lui ont coupé l'herbe sous le pied, c'est avec le mode « Storyboard ». Celui-ci permet d'enchaîner plusieurs séquences comme un réalisateur virtuel, tandis que la fonction « Blending » assure des transitions dignes des plus grands studios d'effets spéciaux. De quoi donner des sueurs froides à certains professionnels du secteur.

Exemple de Storyboard durant la démo d'OpenAI. © OpenAI

Des capacités étendues sous contrôle

Sous le capot, Sora s'appuie sur l'architecture qui a fait le succès de DALL-E 3. Résultat ? Une compréhension quasi-intuitive des prompts les plus complexes. La nouvelle version « Turbo », successeur du modèle original présenté en février, apporte des améliorations significatives en termes de vitesse de génération et de qualité visuelle.

Face aux craintes légitimes de dérives, OpenAI n'a pas lésiné sur les protections. Chaque vidéo porte la signature numérique de son créateur grâce aux métadonnées C2PA, et un filigrane discret mais imparable permet d'identifier instantanément les contenus générés par IA. Les contenus sensibles ? Strictement interdits, avec une surveillance accrue des vidéos mettant en scène des personnes.

L'invité ainsi que les différents paramètres avec lesquels jouer. © OpenAI

Si Sora impressionne, elle n'est pas encore parfaite. Les mouvements complexes lui donnent parfois du fil à retordre, et les longues séquences peuvent réserver quelques surprises physiquement improbables. Des limitations que les ingénieurs d'OpenAI s'efforcent activement de corriger. Les utilisateurs européens devront patienter : comme ses prédécesseurs, Sora fait face au mur réglementaire du Vieux Continent. Une situation qui illustre le défi permanent d'OpenAI : innover tout en respectant des cadres légaux en constante évolution.

Les défis de la maturité

Malgré l'introduction de la version « Turbo » et ses améliorations significatives, Sora présente encore certaines limitations techniques. Le modèle peut occasionnellement trébucher sur la reproduction de mouvements physiquement réalistes et manifeste des difficultés dans la gestion d'actions complexes sur des durées prolongées, particulièrement dans les scènes impliquant des interactions humaines sophistiquées.

La barre latérale regroupe différentes options dont un feed présentant les créations d'autres utilisateurs. © OpenAI

Le déploiement initial de Sora exclut temporairement une grande partie de l'Europe, y compris la France, illustrant les défis persistants liés à la conformité réglementaire, notamment vis-à-vis du RGPD et des futures législations sur l'IA. Cette situation rappelle les obstacles similaires rencontrés par ChatGPT, DALL-E et de nombreuses IA concurrentes lors de leurs lancements respectifs dans la région.

OpenAI esquisse déjà les contours de l'avenir de Sora, avec l'introduction prévue en 2025 d'une tarification modulaire adaptée à différents profils d'utilisateurs.

Comment accéder à Sora en France ?

Pour l'heure, les utilisateurs français font face à un obstacle de taille : OpenAI a temporairement suspendu l'accès à Sora dans l'Union européenne. Cette restriction se manifeste techniquement par un bouton de connexion désactivé pour toute adresse IP européenne, rappelant les précédentes limitations observées avec ChatGPT Voice ou sa fonction Mémoire.

Les plus déterminés peuvent néanmoins accéder au service via un VPN configuré sur les États-Unis. Une fois cette étape franchie, le parcours utilisateur se déroule en plusieurs temps : connexion avec ses identifiants ChatGPT, vérification de la majorité, souscription à l'abonnement choisi et visionnage d'un tutoriel d'introduction. L'interface, bien qu'exclusivement en anglais, accepte les prompts en français, permettant aux créateurs francophones de décrire leurs projets dans leur langue maternelle. Un système de file d'attente, particulièrement sollicité depuis le lancement officiel, permet de suivre l'avancement de ses générations.

Source : OpenAI