La pénurie de puces et la totale dépendance à des fournisseurs comme Nvidia ou AMD ont amené la société à développer elle-même des puces spécialisées pour répondre à la demande croissante dans le domaine de l'IA.
Dans son blog, Jake Siegel écrit :
"Les puces représentent une dernière pièce du puzzle pour Microsoft afin de fournir des systèmes d’infrastructure – qui comprennent tout, des choix de silicium, des logiciels et des serveurs aux racks et aux systèmes de refroidissement – qui ont été conçus de fond en comble et peuvent être optimisés en tenant compte des charges de travail internes et des clients".
L'accélérateur Maia 100 sera déployé dans les centres de données de Microsoft dès le début de l'année prochaine, alimentant initialement des services tels que Microsoft Copilot et Azure OpenAI Service. Cette puce, qui compte 105 milliards de transistors et est gravée en 5nm, permettra d'optimiser l'infrastructure Azure en termes de puissance, de performances, de durabilité ou de coût et d'offrir aux clients la flexibilité nécessaire.Sam Altman, l'ex-PDG d'OpenAI qui vient d'être recruté par Microsoft, a déclaré :
"Depuis notre premier partenariat avec Microsoft, nous avons collaboré pour co-concevoir l’infrastructure d’IA d’Azure à chaque couche pour nos modèles et nos besoins de formation sans précédent. Nous avons été ravis lorsque Microsoft a partagé pour la première fois ses conceptions pour la puce Maia, et nous avons travaillé ensemble pour l’affiner et la tester avec nos modèles. L’architecture d’IA de bout en bout d’Azure, désormais optimisée jusqu’au silicium avec Maia, ouvre la voie à la formation de modèles plus performants et à la réduction de ces modèles pour nos clients".
Pour sa part, le processeur Cobalt compte 128 cœurs et est basé sur l'architecture Arm Neoverse Compute Subsystems. Econome en énergie, il a été optimisé pour offrir une efficacité et des performances accrues dans les offres cloud Azure, comme Teams ou SQL Server.Microsoft travaille déjà à la conception de la seconde génération de ces 2 puces.