La plateforme de streaming musical française utilise une IA maison pour identifier les termes injurieux des chansons.
Il y a quelques mois, Deezer dévoilait Spleeter, une technologie permettant d'isoler les pistes vocales et instrumentales d'un morceau, ce qui revenait à diviser un titre en deux, voire en cinq pistes distinctes. Saluée par le monde de la tech et de la musique, l'IA a été exploitée par la plateforme qui a indiqué, mercredi, être en train de développer un tout nouveau système d'analyse par mots-clés des morceaux de son immense catalogue.
Définir les contours de ce qu'est un contenu explicite
Alors qu'à ce jour, seuls les humains décident si une chanson doit être étiquetée comme explicite ou non, Deezer s'est demandée si un système informatique ne pouvait pas le faire automatiquement, en analysant la musique. Mais il s'agit d'une tâche complexe « qui nécessite une compréhension de haut niveau des attentes culturelles et implique beaucoup de subjectivité ».Le système développé par Deezer fait ainsi appel à l'IA Spleeter de façon à détecter les mots et termes « explicites » des titres de la plateforme. Par « explicites », le service précise qu'il entend les termes injurieux et/ou non convenus. Deezer explique toutefois que pour le moment, il n'y a pas de consensus général autour de ce qui doit être considéré comme explicite ou non.
Selon les sources, les cultures et les contenus, la qualification d'un contenu explicite diffère. Généralement, les titres ou albums identifiés comme étant explicites contiennent la mention « Parental Advisory - Explicit lyrics ». Citant Wikipedia, Deezer note qu'« un langage fort (termes sexuels etc.), les représentations de la violence et le discours discriminatoire relèvent de ce qui ne doit pas être entendu par les enfants dans une chanson et doivent donc être marqués comme explicites ».
Lire aussi :
Apple Music promet jusqu'à 50 millions de dollars aux labels indépendants en ce temps de crise
Apple Music promet jusqu'à 50 millions de dollars aux labels indépendants en ce temps de crise
Un système basé sur le machine learning mais pas encore pleinement opérationnel
C'est la première fois qu'un service de streaming développe une telle fonctionnalité de détection des termes explicites basée sur l'audio uniquement. Le système se base sur du machine learning (de l'apprentissage automatique), utilisé pour détecter les mots-clés d'un dictionnaire cible, établi au préalable. Sa décision d'étiqueter une chanson comme explicite se base ensuite sur la présence ou l'absence des mots-clés.Pour l'instant, la fonctionnalité n'est pas tout à fait au point, mais les premiers résultats sont jugés « prometteurs » en interne, et aucun des systèmes boostés à l'IA n'arrive aujourd'hui à la cheville des humains. « Il s'agit d'un fait important à prendre en compte, notamment lorsque l'on tient compte de la sensibilité de la tâche. À ce stade, il n'est pas réaliste d'automatiser complètement un processus de décision pour l'étiquetage de contenu explicite », note Manuel Moussallam, directeur de recherche et développement chez Deezer.
Deezer confirme ainsi que l'innovation ne sera pas directement intégrée dans l'application, mais servira à améliorer, à terme, la plateforme et ses services de recommandation.
Source : Deezer