Evolution de l’IA d’entreprise : IBM et Intel s’associent pour déployer Gaudi 3 sur IBM Cloud

Intel et IBM ont annoncé une collaboration stratégique visant à intégrer les accélérateurs d’IA Intel Gaudi 3 dans IBM Cloud. Ce déploiement, prévu pour début 2025, a pour objectif de rendre l’IA d’entreprise plus abordable, performante, et sécurisée, en s’appuyant sur les capacités des processeurs Xeon de 5e génération d’Intel et les services cloud hybrides d’IBM.

L’un des points clés de cette collaboration est l’amélioration du rapport coût/performance pour les charges de travail d’IA, en particulier dans les environnements de cloud hybride. Grâce à Gaudi 3, IBM Cloud proposera des solutions flexibles et évolutives, permettant aux entreprises d’ajuster leurs ressources en fonction de leurs besoins, ce qui leur permettra réduire les coûts tout en augmentant l’efficacité opérationnelle.

Justin Hotard, vice-président exécutif et directeur général d’Intel Data Center et de l’IA, explique :

“Pour libérer tout le potentiel de l’IA, il faut un écosystème ouvert et collaboratif qui offre aux clients un choix et des solutions accessibles. En intégrant les accélérateurs d’IA Gaudi 3 et les processeurs Xeon à IBM Cloud, nous créons de nouvelles capacités d’IA et répondons à la demande de solutions informatiques d’IA abordables, sécurisées et innovantes.”

L’accélérateur d’IA Gaudi 3

IBM Cloud deviendra ainsi le premier fournisseur de services cloud à intégrer les accélérateurs Gaudi 3, conçus pour le calcul GenAI, présentés en avril dernier par Intel.

Fabriqué selon un processus de 5 nm, doté de vingt-quatre ports Ethernet 200 gigabits intégrés, Intel Gaudi 3 est conçu pour permettre à chaque composant fonctionnel, comme le moteur de multiplication matricielle (MME), les cœurs de processeur Tensor (TPC) et les cartes d’interface réseau (NIC), de travailler simultanément, permettant ainsi d’accélérer le calcul et la mise à l’échelle des opérations de deep learning, lesquelles nécessitent la réalisation simultanée de nombreuses opérations sur de grandes quantités de données.

La mémoire, avec 128 Go de capacité HBMe2 et 3,7 To de bande passante mémoire, répond aux exigences croissantes des LLMs, améliorant ainsi les performances et la rentabilité des charges de travail d’IA.

La combinaison de cette technologie avec les capacités éprouvées des processeurs Xeon de 5e génération offre une infrastructure robuste et performante, adaptée aux besoins variés des entreprises, que ce soit pour le développement, le test ou le déploiement de solutions d’IA.

Elle prend en charge les charges de travail d’IA d’entreprise dans le cloud et dans les centres de données, offrant aux clients une visibilité et un contrôle accrus sur leur pile logicielle, simplifiant ainsi la gestion des charges de travail et des applications.

IBM prévoit également d’intégrer Gaudi 3 à sa plateforme Watsonx, fournissant ainsi aux clients des ressources supplémentaires pour faire évoluer leurs charges de travail d’IA dans des environnements de cloud hybride. Cette intégration permettra d’optimiser le rapport prix/performances pour l’inférence des modèles, contribuant ainsi à une adoption plus large de l’IA dans les entreprises.

Sécurité et résilience au cœur de l’initiative

IBM et Intel s’engagent à fournir des solutions d’IA accessibles à tous les secteurs, y compris ceux soumis à des réglementations strictes. IBM Cloud, connu pour ses capacités de sécurité et de conformité, exploitera Gaudi 3 pour offrir un service d’IA robuste et sécurisé, adapté aux besoins spécifiques des entreprises modernes.

L’intégration de Gaudi 3 dans IBM Cloud Virtual Servers for VPC permettra en outre aux entreprises basées sur x86 d’exécuter des applications plus rapidement et de manière plus sécurisée, améliorant ainsi l’expérience utilisateur.

Les premières offres IBM Cloud avec Gaudi 3 seront disponibles au début de l’année 2025. Les entreprises qui cherchent à rester compétitives dans un paysage technologique en constante évolution pourront ainsi accéder à une infrastructure d’IA puissante, flexible et sécurisée, qui leur permettra de maximiser leur potentiel d’innovation.

Recevez gratuitement l'actualité de l'intelligence artificielle

Suivez la Newsletter de référence sur l'intelligence artificielle (+ de 18 000 membres), quotidienne et 100% gratuite.


Tout comme vous, nous n'apprécions pas le spam. Vos coordonnées ne seront transmises à aucun tiers.
Partager l'article
intelligence artificielle
À PROPOS DE NOUS
Le portail francophone consacré à l'intelligence artificielle et à la datascience, à destination des chercheurs, étudiants, professionnels et passionnés.