Le modèle d'IA chinois DeepSeek, concurrent désigné de ChatGPT, utilise huit fois moins de processeurs que ses concurrents. NVIDIA, qui lui fournit des GPU, sort du silence et salue « une excellente avancée ».

NVIDIA et DeepSeek pourraient contribuer à faire tomber le coût de l'IA © Alexandre Boero / Clubic
NVIDIA et DeepSeek pourraient contribuer à faire tomber le coût de l'IA © Alexandre Boero / Clubic

L'arrivée fracassante de DeepSeek sur la scène de l'intelligence artificielle bouleverse le secteur d'une manière inattendue. La start-up chinoise a réussi l'impensable : développer un modèle d'IA rivalisant avec ChatGPT, tout en utilisant huit fois moins de processeurs NVIDIA. Une prouesse qui a fait s'effondrer le cours de l'action du géant américain des semi-conducteurs de 13% en une seule journée, forçant même l'entreprise à prendre la parole.

DeepSeek chamboule le marché de l'IA avec 8 fois moins de GPU NVIDIA

DeepSeek semble prouver qu'il est possible de faire mieux, avec moins. La start-up chinoise n'a utilisé que 2 000 puces NVIDIA pour développer son modèle, quand ses concurrents en mobilisent plus de 16 000. NVIDIA est aujourd'hui contraint de sortir du silence.

Dans une réaction transmise à Clubic, l'entreprise américaine affirme que « DeepSeek est une excellente avancée en matière d'IA et un parfait exemple de Test Time Scaling », une technique permettant d'optimiser l'utilisation des ressources disponibles, constamment sollicitée dans l'usage d'un robot conversationnel.

Le géant va plus loin en expliquant que « le travail de DeepSeek illustre comment de nouveaux modèles peuvent être créés en utilisant cette technique, en exploitant des modèles largement disponibles et une puissance de calcul totalement conforme aux contrôles à l'exportation ». Une façon de rappeler que la start-up chinoise utilise bien les processeurs NVIDIA dans un cadre légal.

Comment les restrictions américaines ont forcé la Chine à innover dans l'IA

En abaissant drastiquement les barrières à l'entrée, DeepSeek a ouvert de manière inattendue la voie à de nombreuses start-up qui n'auraient pas pu se permettre les budgets pharaoniques jusqu'ici considérés comme indispensables. L'impact de l'explosion du chatbot auprès du grand public sur les marchés financiers est à ce titre considérable.

Au-delà de NVIDIA, c'est tout le secteur des semi-conducteurs qui vacille : Broadcom a chuté de 17%, Micron de 11,71%, et même les géants comme Google et Microsoft ont vu leur action baisser de 3%. Cette démonstration de force soulève évidemment des questions sur l'avenir de l'industrie.

Paradoxalement, ce sont les restrictions américaines sur l'exportation de puces vers la Chine qui ont poussé les entreprises chinoises à innover différemment, privilégiant l'efficacité à la puissance brute. Une approche qui pourrait bien définir l'avenir de l'IA. NVIDIA, qui pourrait s'attirer les foudres du gouvernement américain, reste d'ailleurs confiant dans sa position de leader du marché.

L'entreprise, mastodonte des GPU, indique désormais au sujet de DeepSeek avoir « trois lois de mise à l'échelle : la pré-formation et la post-formation, qui se poursuivent, et la nouvelle mise à l'échelle du temps de test. » La start-up de l'empire du Milieu affirme avoir entraîné son modèle de langage R1 avec des GPU H800, les puces d'IA les moins avancées de NVIDIA.

DeepSeek
  • Compréhension avancée du langage naturel
  • Réponses adaptées à des contextes variés
  • Disponible en plusieurs langues
10 / 10