La start-up française Moments Lab, spécialisée dans l'analyse vidéo par intelligence artificielle, permet à ses clients médias (TF1, BFM TV) et autres de retrouver en moins de deux secondes des séquences marquantes dans leurs archives, parfois massives.
En vulgarisant les choses, on pourrait présenter cette start-up fondée en 2016 par les frères Petitpont comme une sorte de Shutterstock de la vidéo. Mais c'est en fait plus que ça. NewsBridge, devenue MomentsLab depuis quelques semaines, aide ses clients à trouver le moment, le souvenir qu'ils souhaitent retrouver, à travers des pétaoctets d'archives vidéos. Il peut s'agir d'un but marqué par un joueur de foot il y a 20 ans, ou la phrase choc prononcée par un homme politique il y a 10 ans. La promesse de MomentsLab ? Dénicher ce contenu en moins de deux secondes.
À VivaTech, mercredi 22 mai 2024, nous avons rencontré Frédéric Petitpont, CTO (directeur technique) et cofondateur de cette entreprise, qui en plus de compter une cinquantaine de talents, d'être basée à Paris et d'avoir ouvert un bureau à New-York l'an dernier, compte parmi ses clients des journalistes, des producteurs, des monteurs vidéo et… des fédérations sportives.
Moments Lab, comment ça marche
Le client qui veut utiliser la technologie de Moments Lab a deux solutions. Il peut, d'abord, l'utiliser dans un media hub. Ici, les contenus vont être chargés et mis à disposition des équipes internes du client, par exemple les monteurs. Ces derniers vont pouvoir créer un extrait de l'histoire que le journaliste d'un média voudrait raconter.
Par exemple, prenons le fantasque et contesté Javier Milei. Dans la barre de recherche du moteur de Moments Lab, on tape le nom du président argentin, et l'outil nous détecte tous les plans où il est visible. Ceux de son discours de janvier 2024 à Davos sont les premiers à apparaître, en un éclair.
Sur la droite de l'écran, son passage est décrit scène par scène en langage naturel (« Javier Milei arrive à son pupitre »), par exemple. Moments Lab identifie alors les fameux sonores percutants. L'un d'eux ressort plus particulièrement. Ce jour-là, Milei a déclaré « The State is not the solution. The State is the problem itself », une déclaration largement inspirée, presque mot par mot, de celle d'un autre président, Américain cette fois, en la personne de Ronald Reagan. C'était en 1981. Le journaliste et/ou le monteur vidéo vont alors pouvoir sélectionner le moment, le télécharger, et commencer à écrire l'histoire à partir de cette scène.
Aussi une place de marché de la vidéo, très utile aux médias qui veulent rapidement vendre leurs images
L'autre solution pour le média, c'est de carrément mettre en vente ses contenus. Là, Moments Lab prend davantage une position de place de marché, où l'aspect de l'intelligence artificielle générative pour trouver le meilleur moment va aider les médias à trouver ce moment, pour ensuite que ces médias le mette en vente auprès d'autres journalistes ou chaînes internationales. C'est, par exemple, ce que fait la start-up avec TF1 et BFMTV, deux de ses clients.
Frédéric Petitpont reconnaît avoir beaucoup visé les médias au départ, en raison du momentum à saisir. « Mais nos premiers clients ont été les fédérations et entités sportives », parmi lesquelles le LOSC, le club de foot lillois. Ce dernier utilise les services de Moment Lab pour créer des résumés (ou highlights), pour que le club puisse vivre sur les réseaux sociaux et travailler sa notoriété.
La start-up parisienne travaille également avec la Fédération française de Football (FFF), qui dispose d'archives sur un siècle. « Si, admettons, je veux trouver la première fois où on voit Antoine Griezmann filmé sur un terrain de foot, j'entre "Antoine Griezmann terrain", et on remonte le temps pour retrouver cette séquence », nous explique Frédéric.
Une technologie propriétaire, utilisée avec du LLM Mistral et la plateforme Amazon Web Services
Pour faire tourner la machine, Moments Lab utilise la technologie MXT, dont la première version est sortie l'an dernier à Las Vegas, et la seconde il y a tout juste deux mois. « Elle est développée à 100% en interne », nous dit le CTO de la start-up. « Lorsqu'on a besoin d'un LLM (Nldr : un grand modèle de langage), on utilise Mistral. On a aussi pu entrainer notre propre modèle, équivalent pour la vidéo ».
Pour ce qui est de la puissance GPU nécessaire au fonctionnement de ses produits, Moments Lab héberge le tout chez Amazon Web Services (AWS), la branche cloud d'Amazon. La start-up utilise d'ailleurs beaucoup SageMaker, le service d'AWS qui permet de créer et d'entraîner des modèles de machine learning. « Reste que notre technologie est brevetée et qu'elle peut être utilisée sur plusieurs cas d'usage différents ».
Moments Lab pourrait d'ailleurs se voir, un jour, proposer un service pour le grand public. « Nous avons déjà la verticale des créateurs de contenus, qui prend énormément d'importance. C'est quelque chose qu'on va pouvoir adresser, et qu'on adresse d'ailleurs sur certains composants de l'application ». Pour le moment néanmoins, Moments Lab reste focalisée sur les acteurs qui ont un gros patrimoine média.
Un futur très prometteur, compte tenu de l'impact de la vidéo dans la société
L'enjeu autour de la vidéo, c'est de pouvoir créer plus de contenus originaux, plus vite. « On ne va pas se situer dans un cas où on va automatiquement générer du contenu et le publier sans intervention humaine, je ne pense pas que ça existera », prédit Frédéric Petitpont. « Mais on pourra faire 60% de la chaîne de production, c'est-à-dire suggérer du moment, réussir à revenir dans le temps, produire un résumé, un trailer sur un sujet lié, prendre un programme d'une heure et créer ce résumé d'une minute pour TikTok et Instagram ».
Sauf catastrophe, l'entreprise française a de belles heures devant elle. Car nous n'avons même pas encore parlé des grosses plateformes, comme Netflix, Paramount et d'autres, qui ont besoin de plus en plus de contenus, sollicitant des sociétés de production qui essaient de tenir le rythme. Des acteurs comme Moments Lab pourront les aider en ce sens.
Dernier point intéressant enfin : l'originalité des contenus, qui pour certains dépendent beaucoup d'archives identiques ou d'extraits de banques d'images. « Quand on voit un reportage sur le coût de la vie en France, on prend un plan avec quelqu'un qui achète une baguette, et c'est souvent toujours le même plan. De notre côté, on va suggérer des plans un peu plus originaux et un peu plus singuliers, pour qu'il y ait plus de fraîcheur dans les contenus ». Une nouvelle ère de la production vidéo.
30 décembre 2024 à 09h45