Spleeter permet de séparer un fichier audio jusqu'à cinq pistes différentes pour isoler la voix ou un instrument en particulier. L'outil reste complexe à utiliser et sera réservé aux professionnels de l'audio.
Deezer est aujourd'hui connu pour sa plateforme de streaming, mais beaucoup moins pour ses travaux de recherche dans le monde de l'audio. L'entreprise française vient pourtant de dévoiler un nouveau projet, Spleeter, qui utilise l'intelligence artificielle pour isoler les éléments d'un morceau en plusieurs pistes séparées.
Un projet de recherche basé sur l'apprentissage machine
Spleeter se présente sous la forme d'une bibliothèque Python basée sur TensorFlow, l'outil d'apprentissage automatique développé par Google. Le logiciel a été entraîné grâce à une bibliothèque de 20 000 titres de genres divers et variés et dont la voix avait été pré-isolée.Il peut aujourd'hui séparer un morceau en deux, quatre ou cinq pistes distinctes (appelées également stems ou tiges, en français) en isolant par exemple la voix du reste de la musique ou la basse ou la guitare.
L'objectif à atteindre pour les équipes de Deezer était de supprimer au maximum le reste du mix sans l'entendre en bruit de fond comme c'est le cas avec les solutions actuelles.
Les performances de traitement sont très rapides et Deezer explique dans un billet présentant son projet qu'elles sont multipliées par 100 en utilisant un GPU dédié à cette tâche.
Un logiciel réservé aux professionnels de l'audio
Spleeter ne dispose pas d'interface graphique et s'utilise uniquement par ligne de commande. Pour le moment le projet, disponible en open-source sera réservé aux professionnels et Deezer ne prévoit pas de version adaptée à une utilisation grand public.Les possibilités sont très nombreuses et permettront par exemple aux DJ de pouvoir créer des mix en récupérant différents éléments sur plusieurs morceaux ou aux producteurs souhaitant créer des versions karaoké de certains titres.
Deezer utilise également Spleeter en interne « pour des tâches de recherche complexes comme la catégorisation de la musique, la transcription et la détection du langage » comme l'explique Aurelien Herault, Directeur des données et de la recherche chez Deezer à nos confrères de The Verge.
Le projet Spleeter ainsi qu'une documentation complète sont disponibles sur GitHub pour tous ceux souhaitant en apprendre plus sur son fonctionnement et tester ses possibilités.
Source : Synthtopia