Les géants de la tech redoublent d'efforts dans la course à l'intelligence artificielle générative. Alors qu'OpenAI dominait jusqu'ici le segment des modèles de raisonnement avancé avec o1, Google riposte en dévoilant « Gemini 2.0 Flash Thinking », une solution qui promet d'égaler, voire de surpasser, les performances de son rival.
À l'approche des fêtes de fin d'année, la course à l'intelligence artificielle s'intensifie avec l'arrivée d'un nouveau concurrent de taille. Google vient de dévoiler « Gemini 2.0 Flash Thinking », un modèle expérimental d'IA qui entend rivaliser directement avec o1, le fleuron d'OpenAI. Cette annonce illustre la détermination du géant de Mountain View à s'imposer sur le segment des modèles de raisonnement avancé et, accessoirement, de concurrencer OpenAI sur tout ce que l'entreprise propose.
Le raisonnement devient accessible
Le nouveau modèle de Google excelle dans sa capacité à « penser à voix haute » et à exposer explicitement son processus de réflexion. Édifié sur l'architecture Gemini 2.0 Flash, il exploite une approche multimodale permettant l'analyse simultanée de texte, d'images et de contenus audio. Ce dernier point le place au-dessus de la mêlée puisqu'o1 ne prend pas en charge les fichiers audio.
Les évaluations initiales témoignent d'une excellente performance : Gemini 2.0 Flash Thinking occupe la première place du classement Chatbot Arena LLM dans l'ensemble des catégories. Le modèle brille particulièrement dans les domaines des mathématiques, de l'écriture créative et du traitement des requêtes complexes, affichant des progrès remarquables.
L'efficacité du modèle provient de son approche holistique du traitement de l'information, délaissant la juxtaposition de modules spécialisés au profit d'une architecture unifiée. Cette évolution optimise les ressources computationnelles tout en garantissant des performances exceptionnelles.
Un positionnement stratégique face à OpenAI
Face à l'offre premium d'OpenAI à 200 dollars mensuels pour o1, Google adopte une stratégie d'accessibilité en proposant son modèle via Google AI Studio et Vertex AI. Cette décision n'est pas anodine : le modèle est encore expérimental et Google veut le déployer dans un environnement contrôlé avant de le proposer aux développeurs avec une API puis au grand public sur Gemini .
Les capacités du modèle trouvent leur utilité dans un large éventail de domaines professionnels, de la recherche scientifique à l'analyse de données complexes. Les tests révèlent certaines limitations dans la gestion de tâches élémentaires, un paradoxe pour un système aussi sophistiqué. Google qualifie cette version de première étape, laissant entrevoir des améliorations futures. Notons aussi que d'autres acteurs travaillent activement sur des modèles de raisonnement. Du côté de la Chine, la startup DeepSeek
Source : Google
- Un modèle de génération puissant
- Une base de connaissances actualisée en temps réel
- Gratuit et intégré à l'écosystème Google