Les modèles de langage développés par Mistral AI sont déjà reconnus pour leur qualité et leur efficacité. © Ralf Liebhold / Shutterstock
Les modèles de langage développés par Mistral AI sont déjà reconnus pour leur qualité et leur efficacité. © Ralf Liebhold / Shutterstock

La licorne tricolore frappe un grand coup avec Pixtral 12B, son tout premier modèle d'IA capable d'analyser à la fois du texte et des images. Preuve que l'Hexagone n'est absolument pas sur le bas-côté de l'arène de l'IA.

L'écosystème français de l'IA vient tout juste de franchir un cap important. Alors que les géants américains et chinois semblaient avoir pris une longueur d'avance dans le domaine de l'intelligence artificielle multimodale, Mistral riposte avec brio. La startup, fondée il y a à peine plus d'un an et propulsée par une levée de fonds démesurée au mois de juin, marque un grand pas en avant avec son dernier-né, Pixtral 12B.

Un colosse numérique made in France

Pixtral 12B, avec ses 12 milliards de paramètres, s'impose d'emblée comme un poids lourd de l'IA. Ce modèle d'environ 24 Go, héritier du modèle textuel Nemo 12B (fruit de la collaboration entre Mistral AI et NVIDIA), fait voler en éclats les barrières entre la compréhension visuelle et le textuelle.

Qu'il s'agisse d'URL ou d'images encodées en base64 (représentation textuelle d'une image), Pixtral 12B les analyse sans broncher. De la génération de légendes à l'examen de contenu visuel, il toise les géants du secteur : Claude d'Anthropic ou GPT-4 d'OpenAI, pour ne citer qu'eux.

Quelles perspectives d'applications peut-on imaginer ? Le panel est assez large : reconnaissance visuelle, décryptage de contenu multimédia, assistance aux malvoyants… Pixtral 12B pourrait bien trouver de nombreux usages, allant de la recherche fondamentale aux applications industrielles les plus pointues.

 Pixtral 12B peut analyser des images, identifier des objets, compter, générer des descriptions textuelles, et même sous-titrer des images. © Mehaniq / Shutterstock
Pixtral 12B peut analyser des images, identifier des objets, compter, générer des descriptions textuelles, et même sous-titrer des images. © Mehaniq / Shutterstock

Open source : Mistral joue cartes sur table

Là où Mistral la joue fine, c'est dans sa stratégie de diffusion. En optant pour une licence Apache 2.0, l'entreprise française embrasse résolument l'open source. Une orientation qui n'est pas sans rappeler celle de Meta avec son modèle, Llama.

Disponible sur GitHub et Hugging Face, le modèle s'offre ainsi aux développeurs du monde entier, prêt à être affiné et exploité sans entrave. Cette démarche tranche avec la culture du secret chère à d'autres ténors de l'IA. Sophia Yang, à la tête des relations développeurs chez Mistral, annonce déjà l'intégration de Pixtral 12B aux plateformes maison, La Plateforme et Le Chat.

Avec son nouveau bébé, Mistral hisse donc bien haut les couleurs de la France sur la scène mondiale de l'intelligence artificielle. Puissant et accessible, Pixtral 12B pourrait bien devenir la référence du Vieux Continent. De plus, si une communauté de développeurs active autour de celui-ci accélère son développement et l'enrichit de nouvelles fonctionnalités, il pourrait vite se muer en incontournable.

  • Peut tourner en local selon votre configuration
  • Open-source
  • API peu coûteuse

Source : Tech Crunch