Microsoft vient de dévoiler deux déclinaisons de son petit modèle de langage Phi-4, et ils revendiquent des performances impressionnantes malgré leur taille. De quoi changer la donne dans le paysage de l'intelligence artificielle (IA) ?

Microsoft compte rester l'un des leaders dans l'IA. © Below the Sky / Shutterstock
Microsoft compte rester l'un des leaders dans l'IA. © Below the Sky / Shutterstock

Il y a près d'un an, le géant de Redmond présentait Phi-3, un modèle d'intelligence artificielle puissant, mais de petite taille, conçu pour être plus économe en ressources. En décembre, la société réitérait avec Phi-4, qui possède désormais deux nouvelles versions : Phi-4-multimodal et Phi-4-Mini.

« Ces modèles sont conçus pour traiter efficacement des tâches complexes, ce qui les rend idéaux pour les scénarios d'urgence et les environnements où les ressources informatiques sont limitées », promet Microsoft.

Petits, mais robustes

En mesure de gérer simultanément le texte, les images et la parole, Phi-4-multimodal exploite une technologie baptisée « Mixture of LoRAs ». Elle permet d'intégrer plusieurs modalités sans compromettre les performances, un défi majeur dans le développement des systèmes d'IA multimodaux. Cette spécificité lui offre des capacités auparavant réservées aux modèles bien plus volumineux, Phi-4-multimodal ne disposant « que » de 5,6 milliards de paramètres. Ainsi, l'IA maintient de fortes capacités linguistiques tout en ajoutant la reconnaissance visuelle et vocale.

De son côté, Phi-4-Mini revendique 3,8 milliards de paramètres. À titre de comparaison, Phi-4 en possède 14 milliards. Les grands modèles de langage, eux, en comptent beaucoup plus, à l'instar des 200 milliards de GPT-4o. Malgré sa taille minime, Phi-4-Mini surpasse ses concurrents de taille similaire et, pour certaines tâches, égale ou dépasse même celles d'IA deux fois plus grandes.

« Ces modèles sont conçus pour offrir aux développeurs des capacités d'IA avancées. Phi-4-multimodal, avec sa capacité à traiter simultanément la parole, la vision et le texte, ouvre de nouvelles possibilités pour la création d'applications innovantes et sensibles au contexte », explique Weizhu Chen, vice-président de l'IA générative chez Microsoft, dans un billet de blog.

Microsoft continue de progresser dans le domaine des petits modèles d'IA. © Framalicious / Shutterstock
Microsoft continue de progresser dans le domaine des petits modèles d'IA. © Framalicious / Shutterstock

Rendre l'IA plus accessible

Dans le secteur de l'IA générative, les petits modèles remettent en question l'idée que plus les IA sont grandes, meilleures elles sont. Ils permettent de réduire drastiquement la nécessité de puissance de calcul, un enjeu majeur, non seulement d'un point de vue environnemental, mais également pour l'accessibilité de l'IA.

Car ces modèles peuvent fonctionner en local, les rendant utilisables dans des industries où les moyens financiers et techniques sont limités. « Imaginez une société de services financiers intégrant Phi-4-mini pour automatiser des calculs financiers complexes, générer des rapports détaillés et traduire des documents financiers en plusieurs langues », illustre Microsoft.

À voir si le lancement de ces modèles lui permettra de garder sa légère avance dans la filière ô combien compétitive de l'IA. Ils sont disponibles via trois plateformes : Azure AI Foundry, Hugging Face et NVIDIA API Catalog.

À découvrir
Quelles sont les meilleures IA pour générer vos contenus ? Comparatifs 2025

30 décembre 2024 à 11h18

Comparatifs services

Sources : Microsoft, Neowin