NVIDIA veut frapper fort avec Blackwell, une architecture qui promet de révolutionner les performances graphiques et l'intégration de l'IA dans les jeux et la création de contenu. Dévoilée au CES 2025, cette nouvelle génération soulève autant d'espoir que de questions quant à son impact réel.

© Colin Golberg et NVIDIA
© Colin Golberg et NVIDIA

Lors du CES 2025, NVIDIA a levé le voile sur Blackwell, la dernière architecture qui anime la série GeForce RTX 50. En combinant des performances accrues, une intégration renforcée de l'IA et des innovations matérielles, Blackwell se positionne comme une évolution importante pour les joueurs, les développeurs et les créateurs. Les premières cartes graphiques à en bénéficier seront les GeForce RTX 5090, 5080, 5070 Ti et 5070. Toutefois, en l'absence de tests concrets, il convient d'analyser les promesses techniques annoncées avec un regard critique.

Un bond technologique avec les cœurs Tensor de 5ᵉ génération

Sur Blackwell, NVIDIA conserve une finesse de gravure en 4 nanomètres, mais passe au procédé TSMC N4P, offrant une meilleure densité de transistors et une efficacité énergétique accrue.

Les cœurs Tensor de cinquième génération représentent le pilier central de Blackwell. La prise en charge du format FP4 est une évolution notable : elle double les performances de calcul des modèles neuronaux tout en réduisant de moitié l'empreinte mémoire. Cette amélioration repose sur un compromis essentiel : le FP4 (Floating Point 4 bits) utilise une précision moindre que les formats traditionnels comme le FP16 ou le FP32. Cependant, pour de nombreux modèles d'apprentissage profond, cette précision est suffisante pour conserver des résultats fiables tout en allégeant considérablement la charge sur la mémoire et les unités de calcul.

Le passage en FP4 permet de doubler les performances de calcul au détriment d'une précision moindre © NVIDIA
Le passage en FP4 permet de doubler les performances de calcul au détriment d'une précision moindre © NVIDIA

Le passage au FP4 permet également de charger davantage de données en parallèle dans les cœurs Tensor, augmentant ainsi le débit global des calculs neuronaux. Cette innovation s'inscrit dans une tendance à l'optimisation des ressources pour répondre aux besoins croissants des applications d'IA en temps réel, comme la Frame Generation (et donc la Multi-Frame Generation), les textures neuronales compressées ou les simulations de lumières utilisées dans le ray tracing avancé.

Enfin, cette efficacité accrue se traduit aussi par une consommation énergétique réduite. Moins de ressources sont mobilisées pour des tâches similaires, ce qui permet de limiter l'impact thermique des GeForce RTX 50.

AI Management Processor (AMP) : le chef d'orchestre de l'IA

L'introduction du processeur AMP va intelligemment optimiser les charges IA © NVIDIA

L’un des ajouts les plus notables dans l’architecture Blackwell est le AI Management Processor (AMP). Ce processeur dédié joue un rôle clé dans la gestion et l’optimisation des charges IA complexes en coordonnant les différentes unités de traitement (cœurs Tensor, cœurs RT et shaders). Ce processeur vise à maximiser l'efficacité et à réduire les goulots d'étranglement dans les workflows graphiques intensifs.

Fonctionnalités clés de l’AMP

  • L’AMP alloue dynamiquement les ressources GPU selon les besoins en temps réel. Par exemple, pour un jeu utilisant à la fois le ray tracing et les shaders neuronaux, l’AMP garantit que les cœurs Tensor et les cœurs RT travaillent en synergie.
  • Grâce à des algorithmes prédictifs, l’AMP peut anticiper les besoins en calcul en fonction des scènes à venir, optimisant ainsi l’utilisation des ressources GPU.
  • En combinant des capteurs thermiques et des algorithmes intelligents, l’AMP ajuste la consommation d’énergie pour maintenir un équilibre entre performance et efficacité énergétique, particulièrement utile sur les PC portables gamer ou créateur.

Applications pratiques

L’AMP trouve des applications dans plusieurs scénarios. Par exemple :

  • Dans un jeu vidéo, il peut gérer l’équilibrage entre le path tracing à rebonds multiples et les effets de particules générés par des shaders IA, garantissant une fluidité optimale.
  • Pour les créateurs, il optimise les workflows dans des logiciels comme Blender ou Unreal Engine, en priorisant les calculs IA critiques comme le rendu des matériaux neuronaux ou la simulation d’éclairage complexe.

Cette centralisation des décisions liées à l’IA devrait permettre une gestion plus fine des ressources et, potentiellement, une réduction des temps de rendu.

Shader Execution Reordering (SER) : optimiser le traitement parallèle

L’architecture Blackwell intègre également le Shader Execution Reordering (SER), une technologie qui révolutionne la manière dont les shaders sont traités sur les GPU. Traditionnellement, les shaders sont exécutés dans un ordre préétabli, ce qui peut entraîner des inefficacités lorsque certaines instructions prennent plus de temps que d’autres. Le SER intervient pour réorganiser dynamiquement les instructions en cours d’exécution, en regroupant les tâches similaires.

Le SER va distribuer efficacement les calculs entre les différents cœurs © NVIDIA

Avantages clés du SER :

  • En réorganisant les tâches de manière adaptative, le SER réduit les cycles d’attente et améliore la parallélisation.
  • Le SER est particulièrement efficace pour les titres utilisant intensivement le ray tracing, car il peut optimiser les calculs liés à l’éclairage global et aux ombres.
  • En diminuant les cycles inutiles, le SER contribue également à réduire la consommation énergétique globale du GPU.

Cette innovation, combinée aux autres technologies de Blackwell comme les RT Cores de 4ᵉ génération, devrait permettre d’exploiter pleinement le potentiel des cartes RTX 50, tout en offrant une compatibilité avec les moteurs de rendu modernes comme Unreal Engine et Unity.

RTX Neural Rendering : promesses, fonctionnalités et compatibilité

Avec Blackwell, NVIDIA introduit les shaders neuronaux. Désormais, les développeurs ont accès aux cœurs Tensor via des API graphiques, grâce à une collaboration avec Microsoft pour créer le standard Cooperative Vectors. Cette API devrait leur permettre d’intégrer directement des modèles neuronaux dans les shaders.

Les shaders neuronaux permettent d’intégrer directement des modèles neuronaux dans les shaders © NVIDIA
  • Neural Materials : ces matériaux utilisent des modèles neuronaux pour recréer des textures complexes, comme des surfaces métalliques ou des tissus multi-couches. NVIDIA promet des compressions de texture jusqu’à un ratio de 7:1, réduisant la mémoire nécessaire pour des rendus de qualité cinématographique en temps réel.
  • Neural Radiance Cache (NRC) : ce système s’appuie sur des réseaux neuronaux pour capturer la propagation de la lumière dans une scène, permettant un éclairage global réaliste avec des ressources réduites.
  • Champs Radiants Neuronaux (NeRF) : ces champs exploitent l’IA pour générer des scènes 3D avec un éclairage dynamique et une profondeur accrue.
  • RTX Skin et RTX Hair : ces nouvelles technologies utilisent des algorithmes neuronaux pour simuler des interactions naturelles avec la peau et les cheveux dans des environnements en temps réel. RTX Skin reproduit la diffusion sous-cutanée de la lumière, capturant ainsi des détails comme les rougeurs ou les variations de texture dues à la lumière. De son côté, RTX Hair permet de rendre des milliers de mèches de cheveux avec des effets réalistes de mouvement et de réflexion, même dans des conditions complexes comme le vent ou des sources de lumière multiples.

Ces fonctionnalités ont été conçues pour tirer parti des cœurs Tensor de dernière génération, mais elles restent compatibles avec toutes les RTX de générations précédentes. Toutefois, les performances maximales, notamment en termes de vitesse, ne sont atteintes qu’avec les cartes Blackwell, grâce à leur intégration matérielle plus avancée qui permet aux cœurs CUDA d'échanger directement avec les cœurs Tensor, les tâches étant distribuées efficacement par l'AMP (voir diagramme). Les anciennes générations auront besoin de plus de cycles pour atteindre le même résultat, réduisant les performances.

Des performances optimisées grâce à la compression neuronale

Un des exemples concrets de ces avancées est le rendu de matériaux. Dans les démos que NVIDIA nous a présentées (tissu en soie et pierre précieuse), les ingénieurs ont démontré une réduction de mémoire significative : un modèle traditionnel nécessitant 47 Mo pouvait être compressé à 16 Mo avec des textures neuronales, sans perte de qualité visible. Cette optimisation est cruciale pour réduire la charge sur les cartes graphiques, notamment dans des environnements complexes comme les jeux AAA ou les outils de création 3D.

Le RTX Neural Rendering n’est pas qu’une amélioration graphique, NVIDIA le présente comme un outil conçu pour transformer les pipelines de développement. Grâce à des API unifiées et des outils intégrés dans les moteurs comme Unreal Engine, les studios peuvent désormais intégrer des technologies de rendu avancées sans nécessiter des ressources matérielles exorbitantes. Cela devrait également permettre d’accélérer le rythme de production et de réduire les coûts, en simplifiant le travail des artistes et des programmeurs.

RTX Mega Geometry : une gestion optimisée des scènes complexes

Avec la 4e génération de RT Cores, Blackwell introduit des améliorations pour le traitement des scènes complexes :

  • Augmentation du taux d’intersection des triangles par huit.
  • Compression des clusters pour réduire la consommation de mémoire.
Les cœurs RT évoluent pour traiter des scènes plus complexes © NVIDIA

Ces avancées permettent de traiter des environnements à haute densité polygonale. Toutefois, la fluidité réelle de ces scènes en conditions de jeu reste à vérifier. Cela-dit, la démo présentée par NVIDIA présentait un niveau de détail totalement hallucinant et semblait tourner à plus de 60 images/sec en 4K. L'un des ingénieurs nous a confié que la frame generation n'était par ailleurs pas activée, car ils n'avaient pas eu le temps de l'implémenter.

La gestion optimisée de la géométrie est particulièrement importante pour les jeux à monde ouvert où les détails environnementaux jouent un rôle clé dans l'immersion. La promesse d'une meilleure efficacité sans sacrifier les performances pourrait inciter les studios à repousser encore davantage les limites visuelles.

Des applications variées pour les développeurs et les artistes

Le RTX Neural Rendering a été pensé pour simplifier le travail des développeurs en offrant une API unifiée et des outils intégrés dans les moteurs graphiques comme Unreal Engine et Unity. Cela permet de créer des environnements visuels complexes sans sacrifier les performances en temps réel. Par exemple, les créateurs peuvent utiliser ces outils pour générer des simulations réalistes de matériaux dans des applications de design industriel ou de modélisation architecturale.

Sur Half-Life 2 RTX, RTX Skin ajoute des effets de transparence sur la peau du headcrab sans surcoût GPU © NVIDIA

Dans les jeux vidéo, cette technologie pourrait améliorer l'immersion en permettant des interactions plus réalistes entre les personnages, les objets et les environnements. Les effets de lumière, de texture et de matière deviennent ainsi plus proches de ce que l'œil humain perçoit dans le monde réel.

DLSS 4 : un bond en avant technologique ?

Le DLSS 4 se distingue par l’utilisation du modèle « Transformer » pour la Multi-Frame Generation. Jusqu’à 15 des 16 pixels par image sont générés par l’IA, ce qui pourrait théoriquement quadrupler les performances. Par ailleurs, le nouveau modèle utilisé devrait marquer une évolution significative en termes de qualité d'image par rapport à l'ancien modèle CNN. Nos premiers tests lors des démos auxquelles nous avons assisté au CES semblent confirmer cela. NVIDIA annonce également une amélioration de la latence grâce à Reflex 2, qui pourrait renforcer l’expérience des joueurs compétitifs.

En pratique, le DLSS 4 représente une avancée majeure pour le ray tracing en temps réel et plus particulièrement les jeux compatibles avec le path tracing, très exigeants en ressources graphiques. Les titres compatibles pourraient offrir des graphismes encore plus immersifs sans sacrifier les performances, ce qui est essentiel pour les joueurs exigeants. Cependant, une adoption massive de cette technologie dépendra de sa compatibilité avec les jeux existants et de l'adhésion des développeurs tiers.

Le DLSS 4 pourra générer 3 images par IA pour une image rendue traditionnellement © NVIDIA

On a testé la démo, et non seulement ces chiffres sont vrais, mais la qualité d'image est meilleure qu'avec le DLSS3, pour une latence identique © NVIDIA

Reflex 2 : réduire la latence pour des expériences ultra-réactives

NVIDIA Reflex 2, inclus dans l’architecture Blackwell, représente une avancée significative dans la réduction de la latence, un aspect crucial pour les jeux compétitifs. Cette technologie vise à optimiser le temps entre l'entrée d'une commande par le joueur et l'affichage de l'action correspondante à l'écran. Reflex 2 promet une réduction de latence allant jusqu'à 75 % par rapport aux générations précédentes.

Reflex 2 promet une réduction de latence allant jusqu'à 75 % par rapport aux générations précédentes. © NVIDIA

Nouveautés principales de Reflex 2

  • Gestion adaptative de la latence : Reflex 2 introduit des algorithmes adaptatifs qui analysent la charge GPU et CPU en temps réel, équilibrant les ressources pour minimiser les retards.
  • Support du DLSS 4 : en exploitant les modèles neuronaux de DLSS 4, Reflex 2 réduit le décalage causé par les processus de reconstruction d'image et d'anti-aliasing.
  • Synchronisation avancée : Reflex 2 améliore la communication entre le GPU et l’écran grâce à des innovations comme la compatibilité native avec les moniteurs G-Sync Reflex, garantissant des taux de rafraîchissement optimaux.

GDDR7 : une bande passante à la hauteur ?

Les cartes RTX 50 intègrent la nouvelle mémoire GDDR7, avec une bande passante de 30 Gbps. Cela représente une avancée significative, notamment pour les applications exigeantes en transfert de données. Cependant, ces performances théoriques devront être vérifiées par nos benchmarks.

La mémoire GDDR7 devrait principalement être fournie par Samsung © NVIDIA

L’impact de cette mémoire rapide pourrait être particulièrement visible dans les applications professionnelles, comme le montage vidéo ou la simulation 3D. Pour les joueurs, cela se traduirait potentiellement par des temps de chargement réduits et une gestion plus fluide des textures haute résolution.

Pour les créateurs : encodage AV1 et production vidéo avancée

NVIDIA cible aussi les professionnels avec des améliorations comme :

  • Encodage AV1 Ultra Haute Qualité : idéal pour les flux 4K en 4:2:2.
  • Neural Video : une automatisation accrue des workflows vidéo, réduisant les temps de production.
L'AV1 ultra haute qualité sera pris en charge © NVIDIA

Ces outils pourraient transformer la création de contenu, mais leur intégration dans les logiciels populaires reste un point d’attention. Les gains annoncés en termes de rapidité d'encodage et de qualité visuelle devront être validés par les créateurs eux-mêmes dans des environnements réels.

Efficacité énergétique : des gains réels avec Max-Q ?

L’optimisation énergétique est un autre aspect mis en avant. Max-Q promet une consommation énergétique réduite de moitié par rapport à la génération précédente, avec des innovations telles que l’accélération du changement de fréquence d’horloge et le power gating avancé. Ces gains pourraient être cruciaux pour les laptops, mais leur impact sur les configurations desktop haut de gamme reste à confirmer.

© NVIDIA
© NVIDIA

Optimisations clés de Max-Q sur RTX 50

  • Dynamic Boost 3.0 : cette fonctionnalité ajuste dynamiquement la répartition de la puissance entre le CPU, le GPU et la mémoire en fonction des besoins en temps réel. Cela permet d’optimiser les performances sans gaspiller d’énergie.
  • Battery Boost : une version améliorée de Battery Boost réduit considérablement la consommation énergétique en mode batterie tout en maintenant des performances acceptables pour le gaming.
  • Power Gating avancé : Blackwell intègre un système de gestion de la fréquence et de la tension des cœurs GPU, réduisant la consommation lorsqu’ils ne sont pas sollicités.

Un écosystème élargi avec NIM RTX et les Blueprints

Enfin, NVIDIA pousse son écosystème IA avec des outils comme NIM RTX, qui simplifient l’intégration de l’IA dans les projets. Les Blueprints RTX offrent des solutions clé en main pour la création de contenus IA, mais leur accessibilité pour les utilisateurs non experts reste une question ouverte.

Les Blueprints RTX offrent des solutions clé en main pour la création de contenus IA © NVIDIA

NIM RTX pourrait devenir un standard pour les développeurs cherchant à intégrer des fonctionnalités IA dans leurs applications. Cependant, la complexité des outils et la courbe d’apprentissage associée pourraient limiter leur adoption à court terme. Il faudra attendre plusieurs mois avant de voir comment les développeurs prendront en main ces outils.

Une architecture prometteuse, mais encore à éprouver

Blackwell apporte un ensemble impressionnant d’améliorations techniques, mais comme pour toute innovation, les résultats devront être validés par nos tests indépendants. L’impact réel de ces avancées dépendra de leur implémentation dans des scénarios concrets et de l’adhésion des développeurs.

La promesse est grande : rendre les jeux et la création de contenu plus immersifs, efficaces et accessibles. Il reste à voir si NVIDIA pourra tenir ses engagements et transformer ces idées en une réalité tangible pour les utilisateurs. Réponse dans quelques jours, quand nous aurons pu tester en profondeur les premiers modèles de GeForce RTX 50.