La start-up chinoise DeepSeek a ébloui à sa sortie, interrogeant sur la manière dont l'IA a pu être entraînée. Et il semble qu'il n'y ait pas que des composants NVIDIA qui aient été utilisés.

© Shutterstock
© Shutterstock

Un nom est sur toutes les lèvres dans le monde de la tech depuis quelques jours : DeepSeek. L'IA de la start-up chinoise a montré des capacités incroyables, au point que beaucoup se sont demandés comment elle pouvait atteindre ce niveau alors que les entreprises de Chine ne peuvent normalement accéder aux meilleurs GPU de NVIDIA, les H100. Certains pensent qu'elles auraient pu en acquérir en contrebande, alors que DeepSeek affirme avoir simplement utilisé des GPU H800. Mais pas seulement semble-t-il !

Les puces Huawei Ascend 910C utilisées par DeepSeek

Avec quoi l'IA DeepSeek R1 a-t-elle été entraînée ? D'après un papier des chercheurs de la société de Hangzhou, un peu moins de 6 millions de dollars d'investissement dans des GPU H800 auraient suffi. Mais selon le spécialiste des modèles de langage, il y aurait eu aussi du matériel local d'utilisé.

En effet, DeepSeek aurait exécuté les tâches d'inférence à l'aide des dernières puces IA de Huawei, les Ascend 910C. Une information qui, si elle venait à se confirmer, montrerait à quel point la Chine continue de vite se développer, même sous la contrainte américaine.

Une nouvelle preuve de la résilience chinoise ?

Pour rappel, la Ascend 910C est une puce développée par Huawei afin d'obtenir un composant qui puisse être aussi puissant que le meilleur GPU de NVIDIA, le H100. Le géant chinois devrait lancer la production de masse de cette puce durant le premier trimestre 2025, même si SMIC affiche pour le moment des rendements assez faibles dans la production de cette puce.

À l'heure actuelle, beaucoup de questions sont posées sur la façon dont le modèle de langage DeepSeek R1 a pu venir au monde. Du côté des géants américains, après avoir salué la performance, le ton a changé. OpenAI accuse en effet maintenant l'entreprise chinoise d'avoir utilisé ChatGPT pour automatiser l'entraînement de ses modèles, sur le principe de la distillation. Ce qui est interdit par les conditions générales d'utilisation du chatbot.

Source : Wccftech

DeepSeek
  • Compréhension avancée du langage naturel
  • Réponses adaptées à des contextes variés
  • Disponible en plusieurs langues
10 / 10