À l'occasion de la GTC 2025, NVIDIA a dévoilé son plan de route pour les trois prochaines années. Au travers de ses futures architectures Vera Rubin, puis Feynman, l'entreprise affiche au fond un projet simple : monter très sérieusement en puissance de calcul pour accompagner le développement d'IA toujours plus percutantes. On fait le point.

Jensen Huang a évoqué des performances démesurées pour l'IA dans les années à venir © Glen Photo / Shutterstock
Jensen Huang a évoqué des performances démesurées pour l'IA dans les années à venir © Glen Photo / Shutterstock

Elle passe souvent inaperçue auprès du grand public, mais la conférence GTC permet tous les ans à NVIDIA de dévoiler son plan de bataille technologique pour les prochaines années. En dépit du lancement en demi-teinte de ses cartes Blackwell, la firme met déjà un pied dans le futur en dévoilant cette fois plus en détail ses deux prochaines architectures vouées aux data centers : Vera Rubin et Feynman. La première arrivera dès 2026 ; la seconde se matérialisera pour sa part à l'horizon 2028.

Toutes les deux auront vocation à servir de base technique pour les puces intégrées aux prochaines générations de cartes graphiques GeForce RTX… cette fois destinées à monsieur Tout-le-Monde. C'est aussi en cela qu'elles nous intéressent.

Vera Rubin : un duo surpuissant pour enterrer Blackwell dès 2026

Mais commençons par la star de la GTC : la nouvelle architecture Rubin. Comme par le passé, NVIDIA annonce ici non pas une, mais deux puces : un CPU nommé Vera et un GPU nommé Rubin, en hommage à l'astronome américaine Vera Rubin célébrée par la marque en 2023. Attendues dès l'année prochaine, ces deux puces remplaceront le duo Grace/Blackwell avec l'objectif d'améliorer significativement les performances en entraînement et inférence d'IA.

Dans le détail, Rubin regroupe deux GPU sur une seule puce pour fournir pas moins de 50 pétaflops de performance d'inférence FP4 par puce. NVIDIA explique que lorsqu'il est configuré dans un rack NVL144 complet, le dispositif fournit alors 3,6 exaflops de puissance de calcul, soit 3,3 fois plus que ce que proposeront bientôt les puces Blackwell Ultra dans le cas d'une configuration similaire.

Côté CPU, la puce Vera comprend pour sa part 88 cœurs ARM custom, pour 176 threads eux-mêmes connectés aux GPUs Rubin via une interface NVLink pouvant atteindre 1,8 To/s.

Voici la feuille de route de NVIDIA pour les trois prochaines années // © NVIDIA
Vera Rubin : un duo surpuissant pour enterrer Blackwell dès 2026 © NVIDIA
© NVIDIA

Durant son intervention à la GTC, Jensen Huang, CEO de NVIDIA, a par ailleurs dévoilé la future évolution de l'architecture GPU Rubin, avec Rubin Ultra… qui ira évidemment plus loin encore.

Annoncé pour le second semestre 2027, Rubin Ultra utilisera cette fois des configurations de rack NVL576 et s'appuiera sur des GPU individuels, composés de quatre matrices, et délivrant chacun jusqu'à 100 pétaflops de puissance de calcul en inférence FP4.

Par rack, les puces Rubin Ultra pourront ainsi développer jusqu'à 15 exaflops (toujours en inférence FP4), soit environ quatre fois plus de puissance que la configuration NVL144 évoquée plus haut pour l'architecture Rubin « classique ». NVIDIA explique en outre que chaque GPU Rubin Ultra comprendra 1 To de mémoire HBM4e dédiée. Un autre monde !

Feynman, ou quand NVIDIA prépare l'avenir

Comme le souligne ArsTechnica, la marque au caméléon s'en tiendra néanmoins, dans un premier temps, à un refresh de l'actuelle architecture Blackwell.

Prévue cette fois pour le second semestre 2025, la puce Blackwell Ultra B300 sera composée de deux GPU délivrant pour leur part un total de 15 pétaflops (en FP4), et dotés chacun de 288 Go de mémoire HBM3e (contre 192 Go actuellement sur les puces Blackwell). Un rack NVL72 complet composé de puces Blackwell Ultra B300 pourra donc délivrer jusqu'à 1,1 exaflops de puissance de calcul… Soit 1,5 x ce que les solutions de NVIDIA permettent dans l'immédiat.

Et comme la firme voit loin, elle commence aussi à nous parler (un peu) de Feynman. Comme évoqué plus haut, cette future architecture (baptisée en l'honneur du physicien américain Richard Feynman) prendra le relai des puces Rubin/Rubin Ultra à l'horizon 2028.

Avec trois ans d'avance, les détails sur les puces Feyman sont, vous vous en doutez, plutôt minces. Jensen Huang a néanmoins indiqué que ces GPU seront accompagnés de CPU Vera (et donc d'ancienne génération a priori).

Selon toute logique, ce sont néanmoins ces puces qui permettront à NVIDIA de commencer à mettre en œuvre ses grands projets en matière d'IA, le tout sur fond de (nouvelle) révolution industrielle. Une révolution qui passera par une démultiplication spectaculaire de la puissance de calcul.

Source : NVIDIA / Tom's Hardware / ArsTechnica