Basses, percus : voix, une AI open source de Deezer permet de séparer les pistes des chansons

Mathieu Grumiaux
Par Mathieu Grumiaux, Expert maison connectée.
Publié le 17 novembre 2019 à 17h30
Mixage

Spleeter permet de séparer un fichier audio jusqu'à cinq pistes différentes pour isoler la voix ou un instrument en particulier. L'outil reste complexe à utiliser et sera réservé aux professionnels de l'audio.

Deezer est aujourd'hui connu pour sa plateforme de streaming, mais beaucoup moins pour ses travaux de recherche dans le monde de l'audio. L'entreprise française vient pourtant de dévoiler un nouveau projet, Spleeter, qui utilise l'intelligence artificielle pour isoler les éléments d'un morceau en plusieurs pistes séparées.

Un projet de recherche basé sur l'apprentissage machine

Spleeter se présente sous la forme d'une bibliothèque Python basée sur TensorFlow, l'outil d'apprentissage automatique développé par Google. Le logiciel a été entraîné grâce à une bibliothèque de 20 000 titres de genres divers et variés et dont la voix avait été pré-isolée.

Il peut aujourd'hui séparer un morceau en deux, quatre ou cinq pistes distinctes (appelées également stems ou tiges, en français) en isolant par exemple la voix du reste de la musique ou la basse ou la guitare.

L'objectif à atteindre pour les équipes de Deezer était de supprimer au maximum le reste du mix sans l'entendre en bruit de fond comme c'est le cas avec les solutions actuelles.


Les performances de traitement sont très rapides et Deezer explique dans un billet présentant son projet qu'elles sont multipliées par 100 en utilisant un GPU dédié à cette tâche.

Un logiciel réservé aux professionnels de l'audio

Spleeter ne dispose pas d'interface graphique et s'utilise uniquement par ligne de commande. Pour le moment le projet, disponible en open-source sera réservé aux professionnels et Deezer ne prévoit pas de version adaptée à une utilisation grand public.

Les possibilités sont très nombreuses et permettront par exemple aux DJ de pouvoir créer des mix en récupérant différents éléments sur plusieurs morceaux ou aux producteurs souhaitant créer des versions karaoké de certains titres.

Deezer utilise également Spleeter en interne « pour des tâches de recherche complexes comme la catégorisation de la musique, la transcription et la détection du langage » comme l'explique Aurelien Herault, Directeur des données et de la recherche chez Deezer à nos confrères de The Verge.


Le projet Spleeter ainsi qu'une documentation complète sont disponibles sur GitHub pour tous ceux souhaitant en apprendre plus sur son fonctionnement et tester ses possibilités.

Source : Synthtopia
Mathieu Grumiaux
Par Mathieu Grumiaux
Expert maison connectée

Journaliste pour Clubic, je couvre essentiellement les sujets concernant la maison connectée et les objets connectés, mais aussi les dernières nouvelles de l'industrie du streaming vidéo, entre autres sujets. Je suis également l'actu d'Apple, marque qui m'accompagne depuis mon premier iPod mini en 2005 (ça ne nous rajeunit pas…)

Vous êtes un utilisateur de Google Actualités ou de WhatsApp ?
Suivez-nous pour ne rien rater de l'actu tech !
Commentaires (0)
Rejoignez la communauté Clubic
Rejoignez la communauté des passionnés de nouvelles technologies. Venez partager votre passion et débattre de l’actualité avec nos membres qui s’entraident et partagent leur expertise quotidiennement.
Commentaires (3)
kast_or

Merci beaucoup pour l article mais… Car il y a un mais… Un article est déjà paru hier sur le sujet : https://www.clubic.com/telecharger/logiciel-musique-et-streaming/deezer/actualite-876216-deezer-spleeter-solution-open-source-separer-pistes-vocales.html :grinning:

schmurtzm

D’une part ça fonctionne mais en plus il faut le dire : c’est assez bluffant !
J’ai testé sous windows, c’est « relativement » simple à utiliser. J’avais testé pas mal de soft pour faire de même (c’est très pratique pour avoir une version permettant de répéter un chant ou bien d’écouter la technique du chanteur) mais là le résultat est excellent !
Bravo !

notolik

C’est un truc de dingue!!!

En plus visiblement il est possible de lui faire « apprendre » :
« It makes it easy to train source separation model (assuming you have a dataset of isolated sources), and provides already trained state of the art model for performing various flavour of separation. »

Je n’ose même pas imaginer le potentiel d’un tel truc.

Abonnez-vous à notre newsletter !

Recevez un résumé quotidien de l'actu technologique.

Désinscrivez-vous via le lien de désinscription présent sur nos newsletters ou écrivez à : [email protected]. en savoir plus sur le traitement de données personnelles