Intelligence artificielle Une solution de Data center clé en main pour l'IA

Pour approfondir le sujet

Sur le même thème :

Après les Etats-Unis, Meta fait le choix de tester son chatbot en Inde et certains pays d’Afrique

En septembre 2023, Meta annonçait le lancement bêta de Meta AI, un assistant IA, aux Etats-Unis. Le chatbot est actuellement en phase de test...

Les géants de la tech, portés par la GenAI : Google franchit de nouveau la barre des 2 billions de dollars

Les GAFAM ou GAMAM (Google, Apple, Facebook (Meta), Amazon, Microsoft) portés par l'essor de l'IA générative, connaissent une croissance importante de leur capitalisation boursière...

Retour sur les principales innovations d’Adobe en matière d’IA générative

Le sommet Adobe Firefly 2023 avait surtout été marqué par la présentation de Firefly, une famille de modèles d’IA générative, qui a d'ailleurs été...

xAI annonce la prochaine disponibilité de Grok 1,5 Vision

La semaine dernière a été, comme pour une grande partie de celles qui l'ont précédée, rythmée par les annonces autour de la GenAI et...

Une solution de Data center clé en main pour l’IA

Les besoins en calcul des chercheurs en IA ne cessent d’augmenter à mesure que la complexité des réseaux de Deep Learning (DL) et des données de training croît de manière exponentielle. Auparavant, le training était limité à quelques GPU, souvent dans des stations de travail. Aujourd’hui, le training utilise couramment des dizaines, des centaines, voire des milliers de GPU pour évaluer et optimiser les différentes configurations et paramètres des modèles. De plus, les organisations comptent plusieurs chercheurs en IA qui doivent tous former de nombreux modèles simultanément. Ces installations sont la marque de fabrique des plus importants laboratoires de recherche et des universités du monde, alimentant l’innovation qui propulse les efforts scientifiques de toute sorte.

La conception et la mise en place d’une infrastructure informatique à grande échelle pour l’IA nécessitent de comprendre les objectifs informatiques de ces chercheurs afin de construire des systèmes rapides, performants et rentables. Pour construire un système flexible capable d’exécuter une multitude d’applications de Deep Learning de façon évolutive, les organisations ont besoin d’un système bien équilibré, qui comprend au minimum :

  • Des nœuds extensibles et puissants avec de nombreux GPU, une grande mémoire et des connexions rapides entre les GPU pour le calcul afin de prendre en charge la variété des modèles DL utilisés.
  • Une interconnexion InfiniBand (IB) HDR à faible latence et à large bande passante, conçue avec la capacité et la topologie nécessaires pour minimiser les goulots d’étranglement.
  • Un serveur de stockage capable de fournir des performances maximales pour les différentes structures de données.

Ces exigences, pondérées par des considérations de coût pour maximiser la valeur globale, peuvent être satisfaites avec les solutions de NVIDIA distribuées par PNY Technologies, les DGX SuperPODS.

DGX SuperPODS PNY

Le NVIDIA DGX SuperPOD™ doté de ses systèmes DGX A100™ offre des performances révolutionnaires, se déploie en quelques semaines sous la forme d’un système entièrement intégré, et est conçu pour résoudre les problèmes de calcul les plus difficiles au monde.
Sa conception introduit des blocs de calcul appelés unités évolutives (SU) permettant le déploiement modulaire d’un DGX SuperPOD complet de 140 nœuds, qui peut ensuite évoluer vers des centaines de nœuds.

Cette architecture a été exploitée dans l’infrastructure NVIDIA DGX SATURNV qui alimente la recherche et le développement de NVIDIA dans les domaines des véhicules autonomes, du traitement du langage naturel, de la robotique, du graphisme, du HPC et d’autres domaines. Les organisations qui souhaitent déployer leur propre infrastructure de supercalculateurs peuvent s’appuyer sur la solution NVIDIA DGX SuperPOD pour les entreprises, déployée dans une solution d’infrastructure clé en main, ainsi qu’un cycle de vie complet de services avancés, de la planification à la conception, en passant par le déploiement et l’optimisation continue.

Les solutions NVIDIA Networking au service du DGX SuperPOD

Les solutions NVIDIA Networking, anciennement Mellanox, leader des infrastructures réseaux InfiniBand et racheté par NVIDIA en 2020, font parties intégrantes des infrastructures DGX SuperPOD. Sonia Cheriet, Sales Manager South Europe chez NVIDIA Networking, nous en dit plus.

Nvidia Networking Mellanox

Quel rôle joue l’infrastructure réseau NVIDIA Networking dans l’architecture des SuperPODS ?

Sonia Cheriet Sr. Channel Sales Manager – Southern Europe, Mellanox Networking Solutions :

« Avec la technologie Nvidia Networking, nous redéfinissons le data center avec une architecture capable de paralléliser les problèmes les plus complexes et de les résoudre le plus rapidement possible. Le DGX A100 est livré avec de nouveaux adaptateurs réseau Mellanox ConnectX-6 VPI avec 200 Gbit/s HDR Infiniband – jusqu’à neuf interfaces par système. Nous profitons de la commutation Mellanox pour faciliter l’interconnexion des systèmes et atteindre l’échelle SuperPOD »

Nvidia Networking DGX SuperPOD

Quels sont les avantages de ces solutions par rapport à d’autres acteurs du Networking ?

Sonia Cheriet Sr. Channel Sales Manager – Southern Europe, Mellanox Networking Solutions :

« Nos solutions de mise en réseau de bout en bout, accélérées par GPU, compatibles avec les protocoles InfiniBand et Ethernet, permettent aux entreprises de mettre en œuvre une infrastructure réseau à même de prendre en charge des implémentations complètes allant du développement au déploiement avec toutes les charges de travail modernes et diverses exigences de stockage, ouvrant ainsi la voie à la nouvelle ère de calcul accéléré pour maximiser votre retour sur investissement en matière d’IA. »

Peut-on retrouver les solutions NVIDIA Networking dans d’autres applications ?

Les solutions de mise en réseau NVIDIA répondent aux demandes en croissance exponentielle d’efficacité de puissance de calcul, de gestion et d’évolutivité accrues requises pour le HPC, le Web 2.0, le ML, l’analyse de données et le marché du stockage. Nous sommes le seul fournisseur à proposer des solutions complètes de bout en bout prenant en charge les technologies de mise en réseau InfiniBand et Ethernet.

Contribution par Martin Jezequel, Product Manager Data Center Solutions, PNY Technologies & Sonia Cheriet Sr. Channel Sales Manager – Southern Europe, Mellanox Networking Solutions.


1ère Marketplace de l'IA et de la transformation numérique vous recommande :
Saimple par Numalis

Saimple est la première solution saas permettant d'analyser et de valider des intelligences artificielles et plus particulièrement des réseaux de n...

 

Contributeur expert

Martin Jezequel

Product Manager Data Center Solutions, PNY Technologies

Partager l'article

Après les Etats-Unis, Meta fait le choix de tester son chatbot en Inde et certains pays d’Afrique

En septembre 2023, Meta annonçait le lancement bêta de Meta AI, un assistant IA, aux Etats-Unis. Le chatbot est actuellement en phase de test...

Les géants de la tech, portés par la GenAI : Google franchit de nouveau la barre des 2 billions de dollars

Les GAFAM ou GAMAM (Google, Apple, Facebook (Meta), Amazon, Microsoft) portés par l'essor de l'IA générative, connaissent une croissance importante de leur capitalisation boursière...

Retour sur les principales innovations d’Adobe en matière d’IA générative

Le sommet Adobe Firefly 2023 avait surtout été marqué par la présentation de Firefly, une famille de modèles d’IA générative, qui a d'ailleurs été...

xAI annonce la prochaine disponibilité de Grok 1,5 Vision

La semaine dernière a été, comme pour une grande partie de celles qui l'ont précédée, rythmée par les annonces autour de la GenAI et...