Meta vient de dévoiler un code d'intelligence artificielle (IA) en open source appelé AudioCraft. Il permet aux utilisateurs de créer de la musique et des sons à partir de simples requêtes écrites.
Quelques semaines après avoir annoncé la commercialisation de son modèle de langage Llama 2 en partenariat avec Microsoft Azure, Meta continue sa percée dans le secteur de l'IA générative.
Des modèles en open source
AudioCraft est composé de trois modèles distincts. Le premier, MusicGen, a été entraîné sur « 20 000 heures de musique appartenant à Meta ou faisant l'objet d'une licence spécifique ». Il est capable de générer de la musique à partir de textes.
Le second est baptisé AudioGen. Formé grâce à des effets sonores publics, il crée des sons à partir de prompts écrits, tels qu'un aboiement de chien ou des bruits de pas. Le dernier modèle est une version améliorée d'EnCodec, qui permet de générer de la musique de « meilleure qualité avec moins d'artefacts ».
« Si l'IA générative a suscité beaucoup d'enthousiasme pour les images, la vidéo et le texte, l'audio semble un peu à la traîne. Des travaux sont en cours, mais ils sont très compliqués et peu ouverts, ce qui empêche les gens de s'y frotter facilement », écrit l'entreprise dans un billet de blog. Elle a décidé de publier le code d'AudioCraft en open source afin que « d'autres chercheurs puissent plus facilement tester de nouvelles approches pour limiter ou éliminer les biais potentiels et l'utilisation abusive des modèles génératifs ».
L'IA est loin de faire l'unanimité dans la communauté artistique
Meta n'est pas le premier géant technologique à lancer un modèle qui génère de l'audio. En janvier dernier, Google présentait MusicLM, une IA capable de composer une musique à partir d'un texte.
Selon Meta, AudioCraft peut donner naissance à une nouvelle vague de chansons, de la même manière que les synthétiseurs ont changé la musique lorsqu'ils sont devenus populaires. Si l'IA est accueillie à bras ouverts par certains artistes, à l'instar de Grimes, d'autres ne cessent d'alerter contre les dangers des IA génératrices pour leur travail. Pour l'heure, les capacités de la technologie dans le domaine musical sont encore limitées, mais il est certain que ses aptitudes vont se multiplier rapidement.
Source : Meta