Intelligence artificielle Une solution de Data center clé en main pour l'IA

Pour approfondir le sujet

Sur le même thème :

NVIDIA GTC : NVIDIA s’apprête à mettre la France à l’honneur cette année

NVIDIA GTC, une conférence globale dédiée à l'avancée de l'intelligence artificielle et de l’informatique accélérée, se tiendra du 18 au 21 mars, marquant une...

Le Monde signe un partenariat pluriannuel avec OpenAI et se dote d’une charte sur l’IA

On savait OpenAI en tractations avec plusieurs médias pour entraîner ses LLM sur leurs publications. En France, c'est avec le journal Le Monde que...

Retour sur Copilot for Finance, l’assistant d’IA lancé en preview par Microsoft

Après avoir lancé Copilot Pro, un abonnement premium pour les particuliers permettant de créer un assistant d'IA personnalisé, Microsoft a récemment annoncé la préversion...

Etude de BpiFrance Le Lab : l’utilisation des IA génératives par les dirigeants de PME-TPE est encore très limitée

Bpifrance Le Lab a publié ce 14 mars une étude sur les usages que font les dirigeants des IA Génératives au sein des TPE...

Une solution de Data center clé en main pour l’IA

Les besoins en calcul des chercheurs en IA ne cessent d’augmenter à mesure que la complexité des réseaux de Deep Learning (DL) et des données de training croît de manière exponentielle. Auparavant, le training était limité à quelques GPU, souvent dans des stations de travail. Aujourd’hui, le training utilise couramment des dizaines, des centaines, voire des milliers de GPU pour évaluer et optimiser les différentes configurations et paramètres des modèles. De plus, les organisations comptent plusieurs chercheurs en IA qui doivent tous former de nombreux modèles simultanément. Ces installations sont la marque de fabrique des plus importants laboratoires de recherche et des universités du monde, alimentant l’innovation qui propulse les efforts scientifiques de toute sorte.

La conception et la mise en place d’une infrastructure informatique à grande échelle pour l’IA nécessitent de comprendre les objectifs informatiques de ces chercheurs afin de construire des systèmes rapides, performants et rentables. Pour construire un système flexible capable d’exécuter une multitude d’applications de Deep Learning de façon évolutive, les organisations ont besoin d’un système bien équilibré, qui comprend au minimum :

  • Des nœuds extensibles et puissants avec de nombreux GPU, une grande mémoire et des connexions rapides entre les GPU pour le calcul afin de prendre en charge la variété des modèles DL utilisés.
  • Une interconnexion InfiniBand (IB) HDR à faible latence et à large bande passante, conçue avec la capacité et la topologie nécessaires pour minimiser les goulots d’étranglement.
  • Un serveur de stockage capable de fournir des performances maximales pour les différentes structures de données.

Ces exigences, pondérées par des considérations de coût pour maximiser la valeur globale, peuvent être satisfaites avec les solutions de NVIDIA distribuées par PNY Technologies, les DGX SuperPODS.

DGX SuperPODS PNY

Le NVIDIA DGX SuperPOD™ doté de ses systèmes DGX A100™ offre des performances révolutionnaires, se déploie en quelques semaines sous la forme d’un système entièrement intégré, et est conçu pour résoudre les problèmes de calcul les plus difficiles au monde.
Sa conception introduit des blocs de calcul appelés unités évolutives (SU) permettant le déploiement modulaire d’un DGX SuperPOD complet de 140 nœuds, qui peut ensuite évoluer vers des centaines de nœuds.

Cette architecture a été exploitée dans l’infrastructure NVIDIA DGX SATURNV qui alimente la recherche et le développement de NVIDIA dans les domaines des véhicules autonomes, du traitement du langage naturel, de la robotique, du graphisme, du HPC et d’autres domaines. Les organisations qui souhaitent déployer leur propre infrastructure de supercalculateurs peuvent s’appuyer sur la solution NVIDIA DGX SuperPOD pour les entreprises, déployée dans une solution d’infrastructure clé en main, ainsi qu’un cycle de vie complet de services avancés, de la planification à la conception, en passant par le déploiement et l’optimisation continue.

Les solutions NVIDIA Networking au service du DGX SuperPOD

Les solutions NVIDIA Networking, anciennement Mellanox, leader des infrastructures réseaux InfiniBand et racheté par NVIDIA en 2020, font parties intégrantes des infrastructures DGX SuperPOD. Sonia Cheriet, Sales Manager South Europe chez NVIDIA Networking, nous en dit plus.

Nvidia Networking Mellanox

Quel rôle joue l’infrastructure réseau NVIDIA Networking dans l’architecture des SuperPODS ?

Sonia Cheriet Sr. Channel Sales Manager – Southern Europe, Mellanox Networking Solutions :

« Avec la technologie Nvidia Networking, nous redéfinissons le data center avec une architecture capable de paralléliser les problèmes les plus complexes et de les résoudre le plus rapidement possible. Le DGX A100 est livré avec de nouveaux adaptateurs réseau Mellanox ConnectX-6 VPI avec 200 Gbit/s HDR Infiniband – jusqu’à neuf interfaces par système. Nous profitons de la commutation Mellanox pour faciliter l’interconnexion des systèmes et atteindre l’échelle SuperPOD »

Nvidia Networking DGX SuperPOD

Quels sont les avantages de ces solutions par rapport à d’autres acteurs du Networking ?

Sonia Cheriet Sr. Channel Sales Manager – Southern Europe, Mellanox Networking Solutions :

« Nos solutions de mise en réseau de bout en bout, accélérées par GPU, compatibles avec les protocoles InfiniBand et Ethernet, permettent aux entreprises de mettre en œuvre une infrastructure réseau à même de prendre en charge des implémentations complètes allant du développement au déploiement avec toutes les charges de travail modernes et diverses exigences de stockage, ouvrant ainsi la voie à la nouvelle ère de calcul accéléré pour maximiser votre retour sur investissement en matière d’IA. »

Peut-on retrouver les solutions NVIDIA Networking dans d’autres applications ?

Les solutions de mise en réseau NVIDIA répondent aux demandes en croissance exponentielle d’efficacité de puissance de calcul, de gestion et d’évolutivité accrues requises pour le HPC, le Web 2.0, le ML, l’analyse de données et le marché du stockage. Nous sommes le seul fournisseur à proposer des solutions complètes de bout en bout prenant en charge les technologies de mise en réseau InfiniBand et Ethernet.

Contribution par Martin Jezequel, Product Manager Data Center Solutions, PNY Technologies & Sonia Cheriet Sr. Channel Sales Manager – Southern Europe, Mellanox Networking Solutions.


1ère Marketplace de l'IA et de la transformation numérique vous recommande :
SCOP - Plateforme d'optimisation de la supply chain par EURODECISION

La plateforme scop regroupe plusieurs modules en optimisation de la supply chain : - module de network design, pour l’optimisation de la localisation...

 

Contributeur expert

Martin Jezequel

Product Manager Data Center Solutions, PNY Technologies

Partager l'article

NVIDIA GTC : NVIDIA s’apprête à mettre la France à l’honneur cette année

NVIDIA GTC, une conférence globale dédiée à l'avancée de l'intelligence artificielle et de l’informatique accélérée, se tiendra du 18 au 21 mars, marquant une...

Le Monde signe un partenariat pluriannuel avec OpenAI et se dote d’une charte sur l’IA

On savait OpenAI en tractations avec plusieurs médias pour entraîner ses LLM sur leurs publications. En France, c'est avec le journal Le Monde que...

Retour sur Copilot for Finance, l’assistant d’IA lancé en preview par Microsoft

Après avoir lancé Copilot Pro, un abonnement premium pour les particuliers permettant de créer un assistant d'IA personnalisé, Microsoft a récemment annoncé la préversion...

Etude de BpiFrance Le Lab : l’utilisation des IA génératives par les dirigeants de PME-TPE est encore très limitée

Bpifrance Le Lab a publié ce 14 mars une étude sur les usages que font les dirigeants des IA Génératives au sein des TPE...