Vous vous souvenez de du modèle superintelligent o1 d'OpenAI ? Il a déjà de la concurrence

Par Naïm Bada, Spécialiste logiciel.

Publié le 21 novembre 2024 à 06h42

Le monde de l'intelligence artificielle vient de vivre un nouveau moment électrisant. Moins de deux mois après le lancement de son modèle o1, OpenAI fait déjà face à un concurrent de taille made in China.

Deepseek a un cerveau de baleine, et on dit ça en bien ! © Deepseek

La startup d'IA chinoise DeepSeek, vient de dévoiler son DeepSeek-R1-Lite-Preview, un modèle d'IA qui pourrait bien faire trembler les ambitions d'OpenAI.

Une approche différente du raisonnement

L'été dernier, OpenAI créait la sensation avec son modèle o1, capable de résoudre 83 % des problèmes mathématiques complexes et de surpasser les performances de GPT-4o. Un véritable séisme dans l'écosystème de l'IA, qui semblait avoir trouvé son nouveau champion du raisonnement intelligent.

Des résultats au niveau d'o1. © Deepseek

DeepSeek vient de faire son entrée fracassante dans la course aux modèles d'IA avec son R1-Lite Preview, un système de raisonnement va chambouler les certitudes d'OpenAI. Les premiers tests sont édifiants : le modèle chinois rivalise désormais directement avec o1 sur des tâches complexes de mathématiques et de programmation.

Un raisonnement transparent, ou du moins plus que celui d'o1... © Naïm Bada pour Clubic

R1-Lite est assez transparent dans son raisonnement et expose ouvertement sa chaîne de pensée (CoT), en se montrant plus bavard que ne l'est o1. Des questions pièges aux demandes plus complexes, force est de constater que le modèle s'en sort vraiment bien. Sa verbose est très appréciable, notamment pour des tâches de code mathématique où une décomposition des tâches peut avoir beaucoup de valeur dans le cadre de l'apprentissage d'un langage.

35 secondes plus tard, la réponse est correcte sur le test « strawberry » auquel tant d'IA échouent. © Naïm Bada pour Clubic

Les implications pour l'écosystème de l'IA

Les premières estimations suggèrent que R1-Lite pourrait proposer des performances comparables à un coût significativement réduit. Une donnée qui pourrait séduire les entreprises et développeurs à la recherche de solutions d'IA plus accessibles. Ce lancement s'inscrit dans une dynamique plus large : la Chine entend bien devenir un acteur majeur de l'intelligence artificielle. Plus tôt ce mois-ci, c'est le modèle QWEN 2.5 Coder 32B d'Alibaba qui créait la surprise avec des performances équivalentes à GPT-4o en code, en ne demandant qu'une fraction de la puissance de calcul.

DeepSeek prévoit de rendre son modèle open source et accessible via une API, confirmant sa volonté de transparence. Cette stratégie tranche avec l'approche plus fermée d'OpenAI et pourrait séduire la communauté des développeurs. Les géants de la tech commencent à douter de l'ancien paradigme : « plus c'est gros, mieux c'est ». Les dernières recherches montrent que simplement augmenter la taille des modèles n'est plus suffisant. Des grands noms comme OpenAI, Google et Anthropic cherchent désormais de nouvelles approches pour repousser les limites de l'IA.

À découvrir

Quels sont les 5 meilleurs chatbots à intelligence artificielle ? Comparatif 2025

04 février 2025 à 14h11

Comparatifs services

Source : Venturebeat

Par Naïm Bada

Spécialiste logiciel

Intelligence artificielle

Actualités High-Tech

Vous êtes un utilisateur de Google Actualités ou de WhatsApp ?
Suivez-nous pour ne rien rater de l'actu tech !

Commentaires (0)

Poster mon commentaire

Commentaires (3)

Binbin

Dans le domaine de l’iA, on constate que l’innovation reste clairement Made in USA.
Les modèles Chinois arrivent toujours après, en tentant, dans certains cas d’usage très spécifique, de faire mieux, le tout accompagné d’une communication très agressive.
Il conviendra aux entreprises de pays démocratiques de se poser les bonnes questions avant de faire le choix d’un modèle Chinois du royaume de la duplicité.

xryl

C’est fort peu connaître le domaine que d’affirmer cela. Il y a des acteurs majeurs en IA dans tous les pays. Les USA sont probablement meilleurs dans la communication (et la pub, le marketing), mais pas dans les specs. En France, nous avons Mistral qui fournit des modèles très performants (supérieurs à ceux de Meta), en open source ou pas. Pour le code, tout le monde connaît Copilot de Microsoft, ou Claude d’Anthropic mais beaucoup utilisent Codestral (dérivé de Mistral), ou DeepSeek Coder (chinois) (sorti en V2 récemment), StarCoder (communauté), OpenCode (d’Infly). En fait, en téléchargeant les outils type LM Studio, on se rend compte de la foultitude de modèles qui existent provenant du monde entier, de celui qui fonctionne bien (et vite) avec « seulement » 4 milliards de paramètres à ceux qui donne un résultat quasi parfait avec 275 milliards de paramètres. DeepSeek se crée une marque en ce moment, comme LLama avec Meta avant, et c’est bien.

Binbin

C’est fort peu me connaître d’affirmer cela.
Ce que je constate, c’est que les Meilleurs Modèles sont très majoritairement Américains.
Si je prends le seul exemple des modèles de Diffusion de génération, d’image, c’est encore plus flagrant. Bien sûr, j’aurais préféré que des Modèles Européen, notamment Français leur tiennent la dragée, mais malheureusement, c’est de moins en moins le cas, notamment pour Mistral, ce milieu évolue très vite, il faut suivre…