Une équipe sino-russe vient de repenser fondamentalement l'exploitation des ressources d'un GPU grand public bien connu. Transformé en un outil de calcul scientifique d'une puissance absolument colossale, la carte graphique utilisé a été poussée à un niveau presque inimaginable.
C'est à Shenzhen (province du Guangdong en Chine), ville symbole de l'innovation technologique chinoise, qu'a eu lieu cette expérience. Cette dernière a été menée conjointement par des chercheurs de l'Université d'État de Moscou Lomonossov et l'Institut de Technologie de Pékin. Les résultats de leurs travaux ont été publiés il y a un peu plus d'un mois, le 8 janvier, dans la revue Chinese Journal of Computational Mechanics.
Quand une RTX 4070 se prend pour un supercalculateur
La péridynamique, théorie mathématique complexe permettant de modéliser les comportements des matériaux à l'échelle atomique, nécessite des ressources informatiques colossales. À quoi sert-elle ?
C'est une théorie non locale, c'est-à-dire une théorie physique où les interactions entre des points ne dépendent pas seulement de leur proximité immédiate, mais également de l'état d'autres points situés à une certaine distance. Elle sert à analyser les interactions entre particules au-delà de leur voisinage immédiat, autorisant la prédiction précise des fractures et des déformations dans les matériaux les plus complexes. Alliages spéciaux, céramiques, silicium ou polymères, par exemple. Traditionnellement, ces calculs exigent des supercalculateurs ou des clusters (ensemble d'ordinateurs interconnectés), limitant leur accessibilité aux grandes institutions disposant d'infrastructures spécialisées.
La Professeure Yang Yang et son équipe ont bouleversé ce paradigme en développant PD-General, un framework qui réinvente l'architecture même du calcul sur GPU. Grâce à une excellente compréhension de l'architecture CUDA de NVIDIA, couplée à une restructuration des schémas de calcul et des flux de données de la carte graphique utilisée pour le test.
La carte graphique en question ? Une simple RTX 4070, et ce qu'ils en ont tiré est assez ahurissant : les calculs s'exécutent 800 fois plus rapidement que les programmes séquentiels classiques et ses performances sont 100 fois supérieures aux solutions parallèles basées sur OpenMP. En seulement cinq minutes, le GPU a pu traiter 4 000 étapes itératives.
Quelles applications sont possibles ?
En permettant de traiter 69,85 millions d'itérations en moins de deux minutes sur des simulations 2D à grande échelle, le framework développé pourrait être exploité pour des applications jusqu'alors inenvisageables sur du matériel grand public. Le secteur aéronautique pourrait théoriquement simuler avec une très haute précision le comportement des matériaux composites de certains aéronefs (comme le Rafale ci-dessus ou l'Airbus A350 XWB, par exemple) sous contrainte. Les bureaux d'études en génie civil disposeraient d'un outil permettant d'anticiper le vieillissement des bâtiments et structures avec une plus grande finesse. Le tout sans débourser des sommes vertigineuses.
Seule ombre au tableau : au moment de la rédaction de cet article, l'étude et ses résultats ne sont pas consultables ni accessibles publiquement. Nous aurions apprécié en savoir un peu plus sur le modus operandi de ces chercheurs et avoir plus d'informations sur ce fameux PD-General. En cherchant directement sur le site de la revue, aucune publication à ce propos n'apparaît.
Sources : Tom's Hardware, South China Morning Post