En ouverture d'une semaine riche en annonces dans l'univers du supercalcul, Nvidia a donné lundi le coup d'envoi officiel de sa nouvelle génération d'accélérateurs basés sur un processeur graphique, la famille Tesla K20. Rappelons que ces cartes sont destinées à venir équiper des stations de travail ou des serveurs spécialisés dans le calcul intensif, principalement dans les univers scientifiques et industriels, où la capacité de traitement massivement parallèle d'un GPU composé de centaines, voire de milliers, d'unités de calcul distinctes, permet une efficacité bien supérieure à celle d'un processeur x86 standard..
Sur le plan technique, la principale nouveauté est donc ici le passage des cartes Tesla de l'architecture Fermi à l'architecture Kepler, que connait le grand public au travers des cartes graphiques de la famille GeForce 600. Nvidia ne colle toutefois pas exactement aux GPU Kepler conçus pour la 3D : il délivre ici le GK110, un nouveau GPU dopé aux hormones avec 7,1 milliards de transistors (contre 3,54 milliards pour le GK104 d'une GeForce GTX 680).
La carte Tesla K20 (stations de travail et serveurs) se trouve ainsi munie de 2 496 coeurs d'exécution CUDA, associés à 5 Go de mémoire GDDR5, pour une bande passante théorique de 208 Go/s. La variante la plus haut de gamme, baptisée K20X et réservée aux serveurs ou supercalculateurs, compte quant à elle 2 688 coeurs CUDA et 6 Go de mémoire vive, avec une bande passante donnée à 250 Go/s. Notons qu'en pratique, la quantité de mémoire utile effectivement disponible pour le système sera moins importante : les mécanismes de correction d'erreur (ECC) monopolisent en effet 12,5% de la capacité totale. Les deux cartes affichent une enveloppe thermique fixée à 225W pour la K20 et 250W pour la K20X.
Outre l'augmentation significative du nombre d'unités de calcul et les apports de l'architecture Kepler (amélioration significative des capacités en calcul double précision par exemple), les K20 misent sur quelques nouveautés architecturales spécifiques au GK110 pour se démarquer de la génération précédente (K10), déjà détaillées par Nvidia lors de ses premières communications sur le sujet et accessibles aux développeurs par l'intermédiaire du kit CUDA 5.0, publié mi-octobre.
On retrouve donc au premier plan Dynamic Parallelism, qui consiste en un jeu de fonctions permettant à un traitement CUDA de lui-même initier de nouveaux traitements, pour ensuite en exploiter les résultats sans que le CPU soit mis à contribution (voir notice technique, en anglais et PDF). La seconde, baptisée Hyper-Q, permet au GK110 d'accepter jusqu'à 32 queues d'exécution (la file d'attente des tâches allouées au GPU), contre une seule sur les cartes de génération Fermi : Nvidia maximise ici le taux d'occupation des unités de calcul et, donc, le rendement.
Du fait de ces raffinements divers, la Tesla K20 atteindrait 1,17 teraflops sur des calculs double précision, et 3,52 teraflops en simple précision. Sa grande soeur la K20X atteindrait quant à elle 1,31 TFlops et 3,95 Tflops dans ces deux cas de figure. Le tout permet à Nvidia de clamer qu'il propose aujourd'hui le meilleur rapport performance / Watt / dollar du marché.
L'américain profite par ailleurs des récentes annonces liées à Titan, le nouveau supercalculateur du laboratoire d'Oak Ridge, pour balayer - sans toutefois commencer plus avant - les hypothèses qui évoquaient des difficultés à produire sans encombre (comprendre avec un rendement satisfaisant) ces énormes GPU : 18 000 cartes ont en effet été livrées dans le cadre de ce contrat, et sont opérationnelles aujourd'hui. La disponibilité générale des Tesla K20 et K20X est fixée à fin novembre à des prix respectifs de 3 200 et 5 000 dollars, avec des intégrations déjà prévues chez plusieurs grands noms du secteur tels que Cray, IBM, SGI, Fujtisu ou HP.