Intelligence artificielle Une solution de Data center clé en main pour l'IA

Pour approfondir le sujet

Sur le même thème :

Deux ans après l’arrivée de ChatGPT, comment la GenAI transforme la recherche en ligne et le marketing

Alors que ChatGPT vient de fêter son second anniversaire et compte aujourd'hui plus de 300 millions d'utilisateurs hebdomadaires, le rapport "Online Search After ChatGPT:...

Llama 3.3 70B : Meta dévoile son dernier ajout à la famille Llama 3, un modèle particulièrement efficace

Alors que Meta prépare le lancement des premiers modèles Llama 4 pour le début de l'année prochaine, l'entreprise a dévoilé en fin de semaine...

AgentLab, un framework open source pour le développement et l’évaluation des agents Web

Lancé par ServiceNow, AgentLab est un framework open source visant à faciliter le développement et l'évaluation d'agents Web. Son objectif principal est de soutenir...

Pleias : des modèles de langages ouverts pour une IA éthique et transparente

Pleias, une start-up française, annonce le lancement de sa première famille de grands modèles de langage (LLM), définissant de nouvelles références en matière...

Une solution de Data center clé en main pour l’IA

Les besoins en calcul des chercheurs en IA ne cessent d’augmenter à mesure que la complexité des réseaux de Deep Learning (DL) et des données de training croît de manière exponentielle. Auparavant, le training était limité à quelques GPU, souvent dans des stations de travail. Aujourd’hui, le training utilise couramment des dizaines, des centaines, voire des milliers de GPU pour évaluer et optimiser les différentes configurations et paramètres des modèles. De plus, les organisations comptent plusieurs chercheurs en IA qui doivent tous former de nombreux modèles simultanément. Ces installations sont la marque de fabrique des plus importants laboratoires de recherche et des universités du monde, alimentant l’innovation qui propulse les efforts scientifiques de toute sorte.

La conception et la mise en place d’une infrastructure informatique à grande échelle pour l’IA nécessitent de comprendre les objectifs informatiques de ces chercheurs afin de construire des systèmes rapides, performants et rentables. Pour construire un système flexible capable d’exécuter une multitude d’applications de Deep Learning de façon évolutive, les organisations ont besoin d’un système bien équilibré, qui comprend au minimum :

  • Des nœuds extensibles et puissants avec de nombreux GPU, une grande mémoire et des connexions rapides entre les GPU pour le calcul afin de prendre en charge la variété des modèles DL utilisés.
  • Une interconnexion InfiniBand (IB) HDR à faible latence et à large bande passante, conçue avec la capacité et la topologie nécessaires pour minimiser les goulots d’étranglement.
  • Un serveur de stockage capable de fournir des performances maximales pour les différentes structures de données.

Ces exigences, pondérées par des considérations de coût pour maximiser la valeur globale, peuvent être satisfaites avec les solutions de NVIDIA distribuées par PNY Technologies, les DGX SuperPODS.

DGX SuperPODS PNY

Le NVIDIA DGX SuperPOD™ doté de ses systèmes DGX A100™ offre des performances révolutionnaires, se déploie en quelques semaines sous la forme d’un système entièrement intégré, et est conçu pour résoudre les problèmes de calcul les plus difficiles au monde.
Sa conception introduit des blocs de calcul appelés unités évolutives (SU) permettant le déploiement modulaire d’un DGX SuperPOD complet de 140 nœuds, qui peut ensuite évoluer vers des centaines de nœuds.

Cette architecture a été exploitée dans l’infrastructure NVIDIA DGX SATURNV qui alimente la recherche et le développement de NVIDIA dans les domaines des véhicules autonomes, du traitement du langage naturel, de la robotique, du graphisme, du HPC et d’autres domaines. Les organisations qui souhaitent déployer leur propre infrastructure de supercalculateurs peuvent s’appuyer sur la solution NVIDIA DGX SuperPOD pour les entreprises, déployée dans une solution d’infrastructure clé en main, ainsi qu’un cycle de vie complet de services avancés, de la planification à la conception, en passant par le déploiement et l’optimisation continue.

Les solutions NVIDIA Networking au service du DGX SuperPOD

Les solutions NVIDIA Networking, anciennement Mellanox, leader des infrastructures réseaux InfiniBand et racheté par NVIDIA en 2020, font parties intégrantes des infrastructures DGX SuperPOD. Sonia Cheriet, Sales Manager South Europe chez NVIDIA Networking, nous en dit plus.

Nvidia Networking Mellanox

Quel rôle joue l’infrastructure réseau NVIDIA Networking dans l’architecture des SuperPODS ?

Sonia Cheriet Sr. Channel Sales Manager – Southern Europe, Mellanox Networking Solutions :

« Avec la technologie Nvidia Networking, nous redéfinissons le data center avec une architecture capable de paralléliser les problèmes les plus complexes et de les résoudre le plus rapidement possible. Le DGX A100 est livré avec de nouveaux adaptateurs réseau Mellanox ConnectX-6 VPI avec 200 Gbit/s HDR Infiniband – jusqu’à neuf interfaces par système. Nous profitons de la commutation Mellanox pour faciliter l’interconnexion des systèmes et atteindre l’échelle SuperPOD »

Nvidia Networking DGX SuperPOD

Quels sont les avantages de ces solutions par rapport à d’autres acteurs du Networking ?

Sonia Cheriet Sr. Channel Sales Manager – Southern Europe, Mellanox Networking Solutions :

« Nos solutions de mise en réseau de bout en bout, accélérées par GPU, compatibles avec les protocoles InfiniBand et Ethernet, permettent aux entreprises de mettre en œuvre une infrastructure réseau à même de prendre en charge des implémentations complètes allant du développement au déploiement avec toutes les charges de travail modernes et diverses exigences de stockage, ouvrant ainsi la voie à la nouvelle ère de calcul accéléré pour maximiser votre retour sur investissement en matière d’IA. »

Peut-on retrouver les solutions NVIDIA Networking dans d’autres applications ?

Les solutions de mise en réseau NVIDIA répondent aux demandes en croissance exponentielle d’efficacité de puissance de calcul, de gestion et d’évolutivité accrues requises pour le HPC, le Web 2.0, le ML, l’analyse de données et le marché du stockage. Nous sommes le seul fournisseur à proposer des solutions complètes de bout en bout prenant en charge les technologies de mise en réseau InfiniBand et Ethernet.

Contribution par Martin Jezequel, Product Manager Data Center Solutions, PNY Technologies & Sonia Cheriet Sr. Channel Sales Manager – Southern Europe, Mellanox Networking Solutions.

Contributeur expert

Martin Jezequel

Product Manager Data Center Solutions, PNY Technologies

Partager l'article

Deux ans après l’arrivée de ChatGPT, comment la GenAI transforme la recherche en ligne et le marketing

Alors que ChatGPT vient de fêter son second anniversaire et compte aujourd'hui plus de 300 millions d'utilisateurs hebdomadaires, le rapport "Online Search After ChatGPT:...

Llama 3.3 70B : Meta dévoile son dernier ajout à la famille Llama 3, un modèle particulièrement efficace

Alors que Meta prépare le lancement des premiers modèles Llama 4 pour le début de l'année prochaine, l'entreprise a dévoilé en fin de semaine...

AgentLab, un framework open source pour le développement et l’évaluation des agents Web

Lancé par ServiceNow, AgentLab est un framework open source visant à faciliter le développement et l'évaluation d'agents Web. Son objectif principal est de soutenir...

Pleias : des modèles de langages ouverts pour une IA éthique et transparente

Pleias, une start-up française, annonce le lancement de sa première famille de grands modèles de langage (LLM), définissant de nouvelles références en matière...