Dans la famille Intelligence Artificielle, on demande DeepSeek ! Depuis quelques jours, ce nom est sur toutes les lèvres. Quelles sont les infos essentielles à connaître sur cette technologie ? Faisons le point ensemble.
Le 20 janvier 2025, la start-up chinoise DeepSeek AI a publié en open source le code de son modèle IA, ébranlant au passage les marchés financiers du monde entier. Soutenue par d'importants apports privés, la technologie s'avère, à la surprise générale, plus puissante et moins énergivore que la version payante de ChatGPT.
Aussi efficace sur le plan de la programmation et du calcul que sur des sujets plus créatifs, le modèle DeepSeek R-1 est devenu, en quelques jours à peine, la coqueluche des utilisateurs. L'objectif est simple : devenir une alternative sérieuse aux IA occidentales.
Que faut-il savoir sur cette intelligence artificielle ? Voici 7 informations à connaître absolument avant de se lancer.
- Compréhension avancée du langage naturel
- Réponses adaptées à des contextes variés
- Disponible en plusieurs langues
1. Qui est derrière DeepSeek ?
On doit DeepSeek à Liang Wenfeng, 39 ans, diplômé de la prestigieuse université du Zhejiang. Cet ingénieur spécialisé en communications et électronique a créé en 2015 le fonds d'investissement High-Flyer Quantitative Investment Management. Spécialisé dans les algorithmes de trading fondés sur l'IA, ce fonds est devenu la maison mère de la start-up DeepSeek AI, lancée quant à elle en 2023.
Fin 2023, DeepSeek AI a lancé son premier modèle IA, DeepSeek Coder. Peu après, la firme a lancé son premier agent conversationnel, fondé sur le modèle open source DeepSeek LLM. En 2024, ces deux technologies sont améliorées, et de nouvelles versions sont déployées. Mais c'est en 2025 que DeepSeek attire véritablement l'attention mondiale, avec la sortie, le 20 janvier, de DeepSeek R-1, un modèle de raisonnement révolutionnaire.
Conformément à la volonté de Liang Wenfeng, cette technologie est partagée gratuitement, sous la licence MIT. L'objectif est de se démarquer des IA américaines en faisant mieux avec moins de moyens. 5,6 millions de dollars auraient été consacrés à l'entraînement de cette IA, contre des centaines de millions pour ses concurrents américains.
2. Quels marchés sont ciblés par DeepSeek ?
L'objectif de DeepSeek est avant tout de répondre aux besoins des utilisateurs asiatiques. Mais ses créateurs ambitionnent clairement de conquérir le marché international en challengeant les modèles occidentaux.
DeepSeek est aujourd'hui l'application IA la plus téléchargée sur le Play Store américain. Comme le rapporte TechCrunch : « Selon la société d'analyse d'applications AppFigures, depuis son lancement à la mi-janvier, l'application DeepSeek a été téléchargée plus de 1,2 million de fois sur le Play Store et plus de 1,9 million de fois sur l'App Store à travers le monde. »
3. Que vaut DeepSeek face à ChatGPT ?
Victime de son succès, DeepSeek a essuyé de nombreuses attaques et a même dû restreindre ses inscriptions. Il faut dire que cette technologie a beaucoup fait parler d'elle récemment.
Dans une étude publiée le 22 janvier dernier, les chercheurs de la société ont, par exemple, montré qu'en matière de performances, DeepSeek dépassait le modèle o1 d'OpenAI, ce qui n'est pas peu dire. Les utilisateurs ne s'y sont pas trompés : nombreux sont ceux qui ont délaissé la semaine dernière leur abonnement payant pour tester cette nouvelle technologie gratuite.
4. Comment est entraînée cette technologie ?
Reposant sur le modèle DeepSeek-V3-Base, cette IA a, pour son entraînement, combiné les techniques du reinforcement learning avec la méthode Group Relative Policy Optimization.
Cependant, tout est loin d'être rose : la start-up DeepSeek est accusée d'avoir siphonné les données d'OpenAI pour entraîner son IA. Elle aurait également contourné les restrictions américaines en utilisant les meilleures puces NVIDIA.
5. Quelles sont les fonctionnalités phares de DeepSeek ?
DeepSeek est un outil conversationnel qui génère des chaînes de pensée avant de formuler des réponses aux prompts de ses utilisateurs. Ses fonctionnalités sont similaires au modèle o1 d'OpenAI. Accessible par un système de chat, il peut générer du texte ou du code, répondre à des questions grâce à sa fonctionnalité « Deep Think » et effectuer des recherches sur le Web. En mode gratuit, il est possible de générer jusqu'à 50 messages en mode « Deep Think ».
6. Une IA pensée pour la gestion de requêtes complexes
DeepSeek est capable de traiter des requêtes complexes avec une redoutable efficacité. S'appuyant sur une architecture « Mixture-of-Experts », elle n'utilise que le strict nécessaire de ressources pour répondre aux requêtes de ses utilisateurs. Cette technologie peut traiter un grand nombre de données en temps réel et tient compte du contexte pour affiner ses réponses.
DeepSeek est notamment capable d'expliquer et de réévaluer son raisonnement. Comme l'explique le consultant Guillaume Besson dans sa tribune publiée sur Medium : « Lorsqu'il rencontre un problème très complexe, le modèle commence par formuler une réponse initiale. Puis, il se met à réévaluer son raisonnement en identifiant d'éventuelles incohérences. »
7. Quelles sont les limites de DeepSeek ?
DeepSeek a un problème majeur : la confidentialité. La société collecte de nombreuses données lors des inscriptions et des interactions avec son service (adresses IP, habitudes d'utilisation, etc.). Les informations sont aussi utilisées pour entraîner l'IA. Stockées sur des serveurs localisés en Chine, elles peuvent être partagées ou utilisées pour de la publicité. On s'en doute, DeepSeek ne respecte pas non plus le RGPD.
Cette IA fait aussi l'objet de censure. Étant soumise aux réglementations chinoises, elle bloque automatiquement un certain nombre de sujets sensibles, comme le rapporte The Guardian.
Malgré ses performances remarquables, il convient donc d'être prudent lorsqu'on utilise cette application, que ce soit en ligne ou en version mobile.
30 décembre 2024 à 11h18