Une solution de Data center clé en main pour l’IA

13 janvier 2022

Les besoins en calcul des chercheurs en IA ne cessent d’augmenter à mesure que la complexité des réseaux de Deep Learning (DL) et des données de training croît de manière exponentielle. Auparavant, le training était limité à quelques GPU, souvent dans des stations de travail. Aujourd’hui, le training utilise couramment des dizaines, des centaines, voire des milliers de GPU pour évaluer et optimiser les différentes configurations et paramètres des modèles. De plus, les organisations comptent plusieurs chercheurs en IA qui doivent tous former de nombreux modèles simultanément. Ces installations sont la marque de fabrique des plus importants laboratoires de recherche et des universités du monde, alimentant l’innovation qui propulse les efforts scientifiques de toute sorte.

La conception et la mise en place d’une infrastructure informatique à grande échelle pour l’IA nécessitent de comprendre les objectifs informatiques de ces chercheurs afin de construire des systèmes rapides, performants et rentables. Pour construire un système flexible capable d’exécuter une multitude d’applications de Deep Learning de façon évolutive, les organisations ont besoin d’un système bien équilibré, qui comprend au minimum :

Des nœuds extensibles et puissants avec de nombreux GPU, une grande mémoire et des connexions rapides entre les GPU pour le calcul afin de prendre en charge la variété des modèles DL utilisés.
Une interconnexion InfiniBand (IB) HDR à faible latence et à large bande passante, conçue avec la capacité et la topologie nécessaires pour minimiser les goulots d’étranglement.
Un serveur de stockage capable de fournir des performances maximales pour les différentes structures de données.

Ces exigences, pondérées par des considérations de coût pour maximiser la valeur globale, peuvent être satisfaites avec les solutions de NVIDIA distribuées par PNY Technologies, les DGX SuperPODS.

DGX SuperPODS PNY

Le NVIDIA DGX SuperPOD™ doté de ses systèmes DGX A100™ offre des performances révolutionnaires, se déploie en quelques semaines sous la forme d’un système entièrement intégré, et est conçu pour résoudre les problèmes de calcul les plus difficiles au monde.
Sa conception introduit des blocs de calcul appelés unités évolutives (SU) permettant le déploiement modulaire d’un DGX SuperPOD complet de 140 nœuds, qui peut ensuite évoluer vers des centaines de nœuds.

Cette architecture a été exploitée dans l’infrastructure NVIDIA DGX SATURNV qui alimente la recherche et le développement de NVIDIA dans les domaines des véhicules autonomes, du traitement du langage naturel, de la robotique, du graphisme, du HPC et d’autres domaines. Les organisations qui souhaitent déployer leur propre infrastructure de supercalculateurs peuvent s’appuyer sur la solution NVIDIA DGX SuperPOD pour les entreprises, déployée dans une solution d’infrastructure clé en main, ainsi qu’un cycle de vie complet de services avancés, de la planification à la conception, en passant par le déploiement et l’optimisation continue.

Les solutions NVIDIA Networking au service du DGX SuperPOD

Les solutions NVIDIA Networking, anciennement Mellanox, leader des infrastructures réseaux InfiniBand et racheté par NVIDIA en 2020, font parties intégrantes des infrastructures DGX SuperPOD. Sonia Cheriet, Sales Manager South Europe chez NVIDIA Networking, nous en dit plus.

Nvidia Networking Mellanox

Quel rôle joue l’infrastructure réseau NVIDIA Networking dans l’architecture des SuperPODS ?

Sonia Cheriet Sr. Channel Sales Manager – Southern Europe, Mellanox Networking Solutions :

« Avec la technologie Nvidia Networking, nous redéfinissons le data center avec une architecture capable de paralléliser les problèmes les plus complexes et de les résoudre le plus rapidement possible. Le DGX A100 est livré avec de nouveaux adaptateurs réseau Mellanox ConnectX-6 VPI avec 200 Gbit/s HDR Infiniband – jusqu’à neuf interfaces par système. Nous profitons de la commutation Mellanox pour faciliter l’interconnexion des systèmes et atteindre l’échelle SuperPOD »

Nvidia Networking DGX SuperPOD

Quels sont les avantages de ces solutions par rapport à d’autres acteurs du Networking ?

Sonia Cheriet Sr. Channel Sales Manager – Southern Europe, Mellanox Networking Solutions :

« Nos solutions de mise en réseau de bout en bout, accélérées par GPU, compatibles avec les protocoles InfiniBand et Ethernet, permettent aux entreprises de mettre en œuvre une infrastructure réseau à même de prendre en charge des implémentations complètes allant du développement au déploiement avec toutes les charges de travail modernes et diverses exigences de stockage, ouvrant ainsi la voie à la nouvelle ère de calcul accéléré pour maximiser votre retour sur investissement en matière d’IA. »

Peut-on retrouver les solutions NVIDIA Networking dans d’autres applications ?

Les solutions de mise en réseau NVIDIA répondent aux demandes en croissance exponentielle d’efficacité de puissance de calcul, de gestion et d’évolutivité accrues requises pour le HPC, le Web 2.0, le ML, l’analyse de données et le marché du stockage. Nous sommes le seul fournisseur à proposer des solutions complètes de bout en bout prenant en charge les technologies de mise en réseau InfiniBand et Ethernet.

Contribution par Martin Jezequel, Product Manager Data Center Solutions, PNY Technologies & Sonia Cheriet Sr. Channel Sales Manager – Southern Europe, Mellanox Networking Solutions.

Pour approfondir le sujet

Deux ans après l’arrivée de ChatGPT, comment la GenAI transforme la recherche en ligne et le marketing

Llama 3.3 70B : Meta dévoile son dernier ajout à la famille Llama 3, un modèle particulièrement efficace

AgentLab, un framework open source pour le développement et l’évaluation des agents Web

Pleias : des modèles de langages ouverts pour une IA éthique et transparente

Une solution de Data center clé en main pour l’IA

Les solutions NVIDIA Networking au service du DGX SuperPOD

Quel rôle joue l’infrastructure réseau NVIDIA Networking dans l’architecture des SuperPODS ?

Quels sont les avantages de ces solutions par rapport à d’autres acteurs du Networking ?

Peut-on retrouver les solutions NVIDIA Networking dans d’autres applications ?

Contributeur expert

Partager l'article

Deux ans après l’arrivée de ChatGPT, comment la GenAI transforme la recherche en ligne et le marketing

Llama 3.3 70B : Meta dévoile son dernier ajout à la famille Llama 3, un modèle particulièrement efficace

AgentLab, un framework open source pour le développement et l’évaluation des agents Web

Pleias : des modèles de langages ouverts pour une IA éthique et transparente

Egalement dans l'actualité de l'intelligence artificielle

Anthropic lance le protocole MCP : une avancée majeure pour connecter...

Agents IA, Azure AI Foundry : les innovations Microsoft présentées à...

Nomination de Clara Chappaz : La voie vers une nouvelle mission...

ActuIA n°17 : ce que vous réserve le nouveau numéro du...

Clara Chappaz nommée à la tête du nouveau Secrétariat d’État chargé...

Performance et santé : le sport à l’ère de l’intelligence artificielle

Dernières contributions d'experts

Après ChatGPT : bilan de la SNIA au 7 décembre 2024

L’IA au service de la croissance : de l’accélération à la...

Smart manufacturing : libérer le potentiel de l’IA en repensant le...

Ajouter ActuIA à votre écran d'accueil