La course à l'IA s'accélère et Meta vient de frapper un grand coup. Le géant des réseaux sociaux a dévoilé SPIRIT-LM, un modèle d'intelligence artificielle capable de mêler texte et parole... tout en étant open-source !

Meta a dévoilé tout un ensemble de modèles destinés à différents usages, mais le plus excitant est sans aucun doute SPIRIT-LM © Meta
Meta a dévoilé tout un ensemble de modèles destinés à différents usages, mais le plus excitant est sans aucun doute SPIRIT-LM © Meta

Alors que ChatGPT fait la une des journaux depuis des mois, notamment avec son mode voix avancé, Meta n'entend pas se laisser distancer. Le groupe de Mark Zuckerberg vient de dévoiler SPIRIT-LM, un nouveau modèle de langage multimodal qui pourrait bien rebattre les cartes.

Sa particularité ? Il est capable d'intégrer à la fois du texte et de la parole, ouvrant la voie à des interactions homme-machine encore plus naturelles et expressives.

Une IA qui comprend vos émotions

SPIRIT-LM n'est pas un simple chatbot textuel comme on en voit fleurir partout. Ce modèle multimodal va beaucoup plus loin en combinant compréhension du langage écrit et oral. Concrètement, il peut analyser non seulement le sens des mots, mais aussi le ton de la voix, les intonations, bref, toute la dimension émotionnelle de la parole.

Cette approche rappelle sans surprise le mode voix avancé de ChatGPT, lancé en septembre 2024. OpenAI avait alors vanté la capacité de son IA à « comprendre les émotions et répondre en conséquence ». Meta semble donc emboîter le pas à son concurrent, tout en allant plus loin. Car l'autre grande force de SPIRIT-LM, c'est son caractère open source. Contrairement à des modèles comme GPT-4, dont le fonctionnement reste secret, Meta a choisi de partager librement son IA avec la communauté scientifique. Une décision qui tranche avec l'approche « boîte noire » d'OpenAI.

Cette ouverture pourrait bien accélérer considérablement les progrès dans le domaine de l'IA conversationnelle. En permettant à des chercheurs du monde entier d'étudier et d'améliorer SPIRIT-LM, Meta mise sur l'intelligence collective pour faire avancer la technologie plus rapidement. C'est aussi un pied-de-nez à OpenAI et son modèle GPT, dont le caractère fermé est de plus en plus critiqué.

En ouvrant son code, Meta se positionne comme un acteur plus « éthique » et transparent du secteur de l'IA. Un argument qui pourrait peser lourd à l'heure où les régulateurs s'inquiètent des dérives potentielles de ces technologies.

Meta se veut plus transparente qu'OpenAI sur le fonctionnement de son chatbot conversationnel © Shutterstock
Meta se veut plus transparente qu'OpenAI sur le fonctionnement de son chatbot conversationnel © Shutterstock

Vers une nouvelle ère d'assistants virtuels ?

Avec SPIRIT-LM, on entrevoit déjà les contours des assistants virtuels de demain. Fini Alexa et ses réponses standardisées : place à des IA capables de tenir une vraie conversation, avec toutes les subtilités du langage humain. On imagine aisément les applications dans le domaine du service client, de l'éducation ou même de la santé mentale.

Des chatbots capables de détecter la détresse dans la voix d'un utilisateur et d'adapter leur réponse en conséquence, ça ne relève plus de la science-fiction ! Bien sûr, cette technologie soulève aussi son lot de questions éthiques. Une IA capable de manipuler les émotions, ça fait un peu froid dans le dos. Il faudra être vigilant sur les garde-fous mis en place pour éviter les dérives.

  • Intégration multiplateforme
  • Modèles open-source Llama 3
  • Fonctionnalités de génération d'images et vidéos

Source : VentureBeat