L'IA de la start-up chinois DeepSeek, DeepSeek R1, impressionne depuis sa sortie par ses performances exceptionnelles. Mais elle aurait eu droit aux meilleures GPU de NVIDIA pour son entraînement.

© Shutterstock
© Shutterstock

DeepSeek, c'est peut-être un nom qui est déjà entré dans l'histoire. L'IA qui réussit à faire aussi bien que le modèle de langage OpenAI o1, considéré jusque-là comme le meilleur du marché, impressionne non seulement pour sa qualité, mais aussi par la façon dont elle aurait été mise au monde. Car d'après ses concepteurs, elle aurait été entraînée sur les GPU H800 de NVIDIA, des composants bridés pour pouvoir être vendus à une époque sur le marché chinois tout en respectant les restrictions imposées par Washington. Une affirmation que certains contredisent.

DeepSeek
  • Compréhension avancée du langage naturel
  • Réponses adaptées à des contextes variés
  • Disponible en plusieurs langues

DeepSeek aurait travaillé avec les meilleures puces de NVIDIA

Alors, comment DeepSeek R1 a-t-elle été entraînée ? Selon le patron de la société d'intelligence artificielle Scale AI, Alexandr Wang, et malgré ce que l'on a pu entendre jusque-là, la start-up de Hangzhou aurait eu accès au meilleur de la technologie actuelle. Ce qui signifie les GPU Hopper H100 produit par NVIDIA.

Dans une interview accordée à la CNBC, il indique ainsi « croire savoir que DeepSeek possède environ cinquante mille H100 ». Et il y aurait une raison très simple au silence sur cette question d'après Alexandr Wang. « Ils ne peuvent évidemment pas en parler parce que cela va à l'encontre des contrôles à l'exportation mis en place par les États-Unis » explique ce dernier.

© Rokas Tenys / Shutterstock

Les restrictions devraient faire sentir leurs effets tôt ou tard

De manière générale, malgré les sanctions américaines, les laboratoires chinois auraient tout de même réussi à se procurer de nombreux GPU H100. « Vous savez, les laboratoires chinois ont plus de H100 qu'on ne le pense » avance-t-il.

Reste que les sanctions ne sont pas si inutiles que ça, puisque qu'elles obligent les entités chinoises à déployer de gros efforts pour obtenir un nombre réduit de GPU. « À l'avenir, ils seront également limités par les contrôles des puces et des exportations que nous avons mis en place » commente Alexandr Wang. Un constat qui pourrait arrêter en plein vol la success story de DeepSeek, si le patron de Scale AI dit vrai.

Source : Wccftech

À découvrir
Quels sont les 5 meilleurs chatbots à intelligence artificielle ? Comparatif 2025

28 janvier 2025 à 14h02

Comparatifs services