NVIDIA présente le GH200 Grace Hopper nouvelle génération dédié à l'IA générative

Lors du Computex, à Taiwan, Jensen Huang, cofondateur et PDG de Nvidia, annonçait la mise en production de GH200 Grace Hopper, une puce conçue pour les applications de centres de donnée et l'IA générative. Deux mois plus tard, il a dévoilé à la conférence Siggraph la seconde génération du processeur, à présent doté de mémoire HBM3e, conçu pour l’ère de l’informatique accélérée et de l’IA générative. Le GH200 Grace Hopper, annoncé en juin dernier, réunit les architectures CPU Nvidia Grace et GPU Hopper basées sur Arm, via la technologie d’interconnexion Nvidia NVLink-C2C à bande passante élevée, faible latence et faible consommation. La superpuce booste 4 PetaFLOPS TE, 72 processeurs Arm connectés par liaison puce à puce, 96 Go de mémoire HBM3 et 576 GPU. Selon Nvidia, le GH 200 seconde génération est le premier processeur HBM3e au monde. Sa double configuration (144 cœurs Arm Neoverse, huit pétaflops de performance d’IA) et 282 Go de la dernière technologie de mémoire HBM3e, fournissent une capacité mémoire jusqu’à 3,5 fois supérieure et une bande passante jusqu’à 3 fois supérieure à l’offre de génération actuelle. La mémoire HBM3e, 50% plus rapide que le HBM3 actuel, offre un total de 10 To/s de bande passante combinée, ce qui permet à la nouvelle plateforme d’exécuter des modèles 3,5 fois plus grands que la version précédente. Créée pour gérer les charges de travail d’IA générative les plus complexes, allant des grands modèles linguistiques aux systèmes de recommandation et aux bases de données vectorielles, elle sera disponible dans une large gamme de configurations. Elle est entièrement compatible avec la spécification de serveur NVIDIA MGX dévoilée elle au Computex. Cette architecture de référence modulaire permet aux fabricants de systèmes et aux clients hyperscale de créer rapidement et à moindre coût plus d’une centaine de variantes de serveurs différentes pour s’adapter à un large éventail d’applications IA, HPC et NVIDIA Omniverse. Sa production devrait débuter d'ici la fin de l'année. Jensen Huang commente :

"Pour répondre à la demande croissante d’IA générative, les centres de données ont besoin de plates-formes informatiques accélérées avec des besoins spécialisés. La nouvelle plate-forme GH200 Grace Hopper Superchip offre cela avec une technologie de mémoire et une bande passante exceptionnelles pour améliorer le débit, la possibilité de connecter des GPU pour agréger les performances sans compromis, et une conception de serveur qui peut être facilement déployée dans l’ensemble du centre de données".

Thierry Maubant

Rédaction ActuIA — actualités, données et analyses sur l'intelligence artificielle pour les décideurs.

NVIDIA présente le GH200 Grace Hopper nouvelle génération dédié à l'IA générative

Avec Project DIGITS, NVIDIA entend démocratiser l'accès à l'IA

La conférence NVIDIA GTC revient du 17 au 21 mars 2025 à San Jose (Californie) et online

ByteDance prépare ses propres CPU Arm et RISC-V pour reprendre le contrôle du coût par token