Un caméléon photoréaliste suffira-t-il à faire oublier les soucis d’OpenAI ? Le nouveau chouchou de la Silicon Valley l’espère bien puisque l’entreprise cherche à fuir une nouvelle polémique.
Peut-on faire confiance aux IA et à celles et ceux qui les développent ? C’est la question qui se pose, en creux, suite à une interview de Mira Murati, responsable technologique d’OpenAI, par le Wall Street Journal. Invitée à présenter Sora, la nouvelle IA de création de vidéo récemment annoncé par OpenAI, la responsable a avoué ne pas savoir exactement d’où venaient les vidéos qui ont servi à l’entraînement de la machine.
OpenAI absorbe tout
Au moment où OpenAI (et l’industrie de l’intelligence artificielle en général) est prise entre de multiples controverses sur l’exploitation abusive de données, entendre une responsable avouer publiquement ne « pas être certaine » d’où viennent les données qui ont servi à l’entraînement d’une machine n’a rien de particulièrement rassurant. Expliquant ne pas vouloir « rentrer dans les détails » sur le sujet, Mira Murati a ensuite expliqué qu’il s’agissait en tout cas de données « publiques » ou dont OpenAI « possédait les droits d’exploitations ».
L’entreprise a confirmé ensuite qu’une partie des données venait de Shutterstock, la banque d’image bien connue, mais il est très probable que cela ne constitue qu’une goutte d'eau dans l’océan de données ingérées par Sora. Une nouvelle fournée de vidéos générés par Sora laisse effectivement imaginer que la nouvelle machine d’OpenAI s’est entraînée sur d’autres contenus que les vidéos, somme toute assez banales, de Shutterstock.
Des sources d'inspirations multiples
Sur Instagram, on peut par exemple voir la vidéo très mignonne d’un chaton avec un bandeau de pirates chevauchant un aspirateur robot. Si certains modèles 3D semblent encore rudimentaires, on peut clairement voir dans cette vidéo photoréaliste des inspirations venant de YouTube, qui depuis 10 ans documente allégrement les relations entre nos félins de compagnie et nos aspirateurs robots. Certains vidéos de ce type dépassent les 10 millions de vues aujourd’hui.
Une autre vidéo, montrant cette fois un caméléon perché sur une branche, semble effectivement tout droit sortie d’une banque d’image avec ce piqué caractéristique et sa profondeur de champ extrêmement réduite.
S’il est indéniable que les vidéos générés par Sora sont d’une qualité impressionnante, en témoigne ces chutes du Niagara de toutes les couleurs ou cet éléphant fait de feuilles d’arbres, le flou qui entoure leur méthode de production laisse perplexe. En pillant tout le contenu vidéo et les modélisations 3D disponibles sur le web sans nécessairement demander l’avis des auteurs et autrices derrière, OpenAI s’expose à un backlash similaire à ce qui se passe actuellement du côté des photographes et dessinateurs qui « empoisonnent » leurs images pour éviter qu’elles servent à l’éducation des IA.
- Text-to-video
- De courtes vidéos très réalistes
- L'IA générative d'Open AI
Source : Wall Street Journal, Instagram - OpenAI