La plateforme de partage de vidéos a été très fortement utilisée par de nombreux géants de la tech pour développer des IA. Comment YouTube va-t-il réagir ?
Quand on développe des IA génératives, et pour arriver à des résultats comme ChatGPT, il est nécessaire d'utiliser un volume pharamineux de données afin d'alimenter l'intelligence artificielle. Autant dire que les entreprises font feu de tout bois pour pouvoir trouver de nouvelles données, alors que beaucoup sont déjà utilisées. Le problème est tel qu'elles n'hésitent pas à même faire appel à données transmises sans aucune autorisation.
Une base de données énorme issue de YouTube
C'est une grosse information que viennent de nous dévoiler les médias Proof News et Wired. Une énorme base de données issue de YouTube aurait en effet été utilisée sans autorisation par des géants de la tech pour développeur leurs IA.
Et quand on dit « énorme », il ne s'agit pas d'une hyperbole. Ce sont en effet tout simplement plus de 170 000 vidéos, appartenant à quelque 48 000 chaînes, dont les contenus vocaux ont été transcrits au format texte pour ensuite être utilisés. Des créateurs de contenu comme MrBeast ou des médias comme la BBC ou ABC News font partie de ceux qui ont été mis à contribution.
Plusieurs géants se sont servis
D'après les mêmes sources, cette base de données a beaucoup tourné. La preuve, de très grands noms ont mis la main dessus. Apple, mais aussi Salesforce, Nvidia ou même Anthropic, la start-up qui développe le chatbot Claude, font partie des noms cités.
« Apple s'est procuré des données pour son IA auprès de plusieurs entreprises. L'une d'entre elles a récupéré des tonnes de données/transcriptions de vidéos YouTube, dont les miennes. Apple évite techniquement la "faute" dans ce cas, car ce n'est pas elle qui récupère les données » a expliqué le vidéaste américain Marques Brownlee.
« Mais il s'agit d'un problème qui persistera pendant longtemps » a-t-il ajouté, amer, dans un message posté sur X. Reste à savoir maintenant ce que va pouvoir faire de son côté YouTube, dont les règles interdisent normalement ce genre de collecte.
- Grand catalogue de contenu vidéo
- Chaînes sans limites sur les thématiques
- Gratuit
Source : The Verge