YouTube va utiliser l'intelligence artificielle pour permettre de doubler rapidement les vidéos mises sur la plateforme.
C'était l'une des promesses de la nouvelle direction : proposer des outils d'IA aux producteurs de contenu de la plateforme. Une mesure évoquée il y a à peine quelques mois et qui devrait bientôt apporter du nouveau pour le doublage des vidéos sur la plateforme.
Aloud au rapport
Sur YouTube, nous sommes nombreux à consommer des vidéos produites à l'étranger, et donc dans une langue qui peut nous échapper. En général, pour nous y retrouver, il peut être nécessaire d'activer des sous-titres qui ne sont pas particulièrement précis. Conscient de ce petit problème, le géant du streaming vidéo va bientôt proposer un nouveau service de doublage.
Pour cela, il va faire appel à une équipe de la société Aloud, issue de son incubateur interne Area 120 by Google et qui propose un service de doublage alimenté par l'IA. Son utilisation est simple : l'intelligence artificielle analyse la vidéo, transcrit son contenu pour qu'il soit vérifié par le créateur, et une fois l'ensemble validé, procède à la traduction, puis derrière, au doublage.
Quelques langues disponibles pour le moment
La nouvelle fonctionnalité est déjà en cours d'essai chez plusieurs centaines de créateurs de la plateforme, selon un responsable interrogé par The Verge. Actuellement, l'outil fonctionne seulement avec trois langues, l'anglais, évidemment, ainsi que l'espagnol et le portugais. Mais de nombreux autres idiomes devraient rapidement être ajoutés. Les capacités de l'IA devraient aussi être améliorées pour « faire en sorte que [d'ici 2024,] les pistes audio traduites ressemblent à la voix du créateur, avec plus d'expression et de synchronisation labiale ».
Cette amélioration de l'outil de traduction vidéo n'est pas une nouveauté pour le groupe Alphabet. Il avait en effet déjà présenté le mois dernier son « Universal Translator », un outil dont l'IA était capable de traduire directement une vidéo dans une autre langue, de dupliquer cette même vidéo, et finalement de réinsérer le discours traduit dans les images d'origine. Cette performance avait étonné, tant la voix et le mouvement des lèvres avaient été parfaitement adaptés. Est-ce ce dernier que YouTube met aujourd'hui en application ?
- Grande diversité de contenus
- Monétisation pour les créateurs
- Accessibilité sur toutes les plateformes
Source : The Verge