Anthropic vient de signer un contrat à 1,25 milliard de dollars par mois jusqu'en mai 2029, soit plus de 40 milliards de dollars sur la durée, pour réserver un parc de GPU dont l'opérateur lui-même qualifiait, quelques semaines plus tôt, le taux d'utilisation effectif de «manifestement faible» («embarrassingly low»), à 11 %. À l'aune des revenus annualisés d'Anthropic en avril 2026 - plus de 30 milliards de dollars, ce seul contrat compute absorbe environ la moitié de l'ARR de l'éditeur de Claude, soit de l'ordre de 6,3 fois l'engagement annuel d'OpenAI sur les 11,9 milliards de dollars conclus avec CoreWeave sur cinq ans. L'objet du contrat: l'accès exclusif à la totalité de Colossus 1, le supercalculateur de Memphis, dans le Tennessee - plus de 220 000 GPU Nvidia (H100, H200 et GB200), 300 mégawatts de puissance et une disponibilité en moins d'un mois, comme l'a documenté Business Insider le 20 mai 2026 à partir du S-1 SpaceX et confirmé par un porte-parole d'Anthropic. Une extension à Colossus 2 est prévue. Effets immédiats annoncés sur Claude Code: doublement des limites de débit sur 5 heures pour les abonnements Pro, Max, Team et Enterprise, et suppression du plafonnement aux heures de pointe pour les plans Pro et Max.
Un parc construit par xAI, absorbé par SpaceX, désormais loué à un concurrent
Colossus 1 a été conçu et opéré initialement par xAI, la société d'intelligence artificielle d'Elon Musk, avant son acquisition par SpaceX lors de la fusion en actions intervenue en février 2026. ActuIA avait suivi dès 2024 la quête de puissance de calcul de Musk pour xAI qui a mis sous pression NVIDIA, un supercalculateur conçu pour les charges d'entraînement de Grok à l'échelle du parc Nvidia H100/H200/GB200. Deux éléments contextuels structurent le présent contrat. D'une part, SpaceX a déposé confidentiellement un S-1 auprès de la SEC le 1er avril 2026 en vue d'une introduction en bourse ciblant une valorisation comprise entre 1 750 et 2 000 milliards de dollars, avec un roadshow prévu pour la semaine du 8 juin, selon CoinDesk. D'autre part, Elon Musk a déclaré sur son réseau X vouloir se réserver le droit de récupérer la capacité de calcul si l'IA d'Anthropic «engageait des actions qui nuisent à l'humanité» (traduction libre); le statut contractuel exact de cette clause n'a pas fait l'objet d'une confirmation conjointe des deux parties. Le contexte d'exploitation est lui aussi documenté: le mémo interne de xAI signé par son président Michael Nicolls et obtenu par Business Insider qualifie de «manifestement faible» un taux de Model FLOPs Utilization (MFU) de 11 % sur les quelque 550 000 GPU Nvidia opérés, là où la production-grade de l'entraînement LLM se situe entre 35 et 45 % de MFU, Meta atteignant 43 % sur l'entraînement de Llama 3, Google 46 % sur PaLM, et MegaScale de ByteDance affichant 55,2 % de MFU sur 12 288 GPU lors de l'entraînement d'un modèle de 175 milliards de paramètres, ce dernier résultat étant documenté dans le papier arXiv publié par ByteDance en février 2024.
Mécanique tarifaire: une réservation de capacité, pas un tarif GPU à l'heure
Trois précautions de lecture s'imposent avant toute comparaison de prix. Premièrement, le contrat n'est pas structuré comme un prix à l'utilisation par GPU mais comme une réservation de 300 mégawatts de capacité garantie: le montant mensuel rémunère la disponibilité de l'infrastructure, indépendamment du compute effectivement livré. Rapporté au parc de 220 000 GPU sur 720 heures mensuelles, le coût implicite par GPU et par heure ressort à environ 7,78 dollars selon l'estimation ActuIA. Pour situer cet ordre de grandeur, IntuitionLabs relève que les tarifs H100 à la demande chez AWS et Google Cloud se situent autour de 3 à 4 dollars par GPU et par heure, tandis que des néo-clouds comme Lambda Labs, RunPod, Vast.ai ou Cudo Compute proposent des tarifs descendant à 1,49–2,99 dollars, AWS ayant abaissé ses prix H100 d'environ 44 % en juin 2025. La comparaison directe reste piégée par la nature de l'engagement: le H100 on-demand (à la demande, facturation horaire) est une variable d'ajustement à l'heure, le contrat Colossus est un engagement de capacité sur 36 mois - deux régimes tarifaires qui ne se rapportent pas au même objet.
Deuxièmement, le taux de 11 % de MFU porte sur les entraînements Grok menés par xAI, alors qu'Anthropic destine ces GPU principalement à l'inférence Claude. Les deux régimes ne sont pas comparables: l'entraînement est compute-bound (gourmand en opérations en virgule flottante), l'inférence est principalement memory-bandwidth-bound (limitée par la bande passante mémoire), et la métrique MFU n'est pas un indicateur direct de l'efficience d'un workload d'inférence. Troisièmement, SpaceX a enregistré, selon son S-1, une perte opérationnelle sur le segment AI compute au premier trimestre 2026, dont l'ordre de grandeur (environ 2,5 milliards de dollars sur le trimestre, pour un chiffre d'affaires de segment de l'ordre de 800 millions) place le tarif mensuel d'Anthropic en deçà du seuil de rentabilité actuel de l'opérateur: le prix consenti reflète une décision stratégique de sous-tarification, pas un signal de marché stabilisé. L'extrapolation annualisée à partir de ce seul trimestre demande prudence, le S-1 ne publiant pas de série historique consolidée.
Poids du contrat pour Anthropic et comparable OpenAI/CoreWeave
L'engagement Colossus représente environ 15 milliards de dollars par an sur trois ans, à mettre en regard de la trajectoire de revenus d'Anthropic. Selon le Los Angeles Times, le revenu annualisé (ARR) d'Anthropic a plus que doublé depuis l'été 2025, dépassant 9 milliards de dollars fin 2025, puis 14 milliards en février 2026, 19 milliards en mars et plus de 30 milliards de dollars en avril 2026 (Los Angeles Times). À l'aune de cet ARR d'avril, le seul contrat Colossus mobilise environ la moitié des revenus annualisés d'Anthropic - un ratio sans équivalent récent pour un accord d'infrastructure isolé.
Le comparable sectoriel le plus immédiat est l'accord OpenAI/CoreWeave. Selon The Next Platform, OpenAI a conclu un contrat de cinq ans pour 11,9 milliards de dollars avec CoreWeave, qui dispose d'environ 250 000 GPU répartis dans 32 datacenters (The Next Platform, 11 mars 2025). Soit 2,38 milliards de dollars par an, contre 15 milliards pour Anthropic/SpaceX sur un parc de taille comparable: l'engagement annuel de l'éditeur de Claude est de l'ordre de 6,3 fois supérieur à celui d'OpenAI sur le périmètre néo-cloud public. Une lecture financière du contrat doit aussi intégrer son insertion dans le calendrier de l'introduction en bourse SpaceX. Cette combinaison - capacité sous-utilisée monétisée à taux élevé - renforce mécaniquement le récit de revenus du S-1, indépendamment du rendement effectif du parc.
Ce que Colossus livre à Anthropic, ce que l'orbite n'a pas encore livré
Sur le périmètre opérationnel immédiat, Anthropic affecte la capacité Colossus principalement à l'inférence Claude, un workload distinct de l'entraînement par sa pression dominante sur la bande passante mémoire et par ses contraintes de latence utilisateur. L'extension annoncée à Colossus 2 inscrit le dispositif dans une trajectoire de montée en charge sur le segment inférence, alors que l'éditeur de Claude a vu ses débits utilisateur tendus à plusieurs reprises lors des pics de trafic Claude Code en 2025.
Le second volet de l'annonce, en revanche, n'a pas le même statut. Anthropic a exprimé un intérêt pour développer avec SpaceX plusieurs gigawatts de capacité de calcul IA en orbite, mais aucun contrat n'a été signé à ce stade. MIT Technology Review documente quatre obstacles techniques à un datacenter spatial à cette échelle. Dans le vide spatial, la chaleur ne peut être évacuée que par rayonnement, un processus nettement moins efficace que la convection; les composants électroniques font face à des single-event upsets (perturbations logiques induites par des particules ionisantes), à un dommage cumulatif d'ionisation et à des dommages par déplacement, selon le magazine du MIT, qui ajoute trois facteurs convergents: la température en orbite ne descendrait pas sous 80 °C (soit au-delà de la plage opérationnelle sûre de l'électronique commerciale), les composants durcis spatialement coûtent nettement plus cher et accusent plusieurs années de retard sur l'état de l'art, et l'assemblage orbital à cette échelle requerrait des systèmes robotiques qui n'existent pas. Le projet relève, à la date du 21 mai 2026, du registre déclaratif: aucune annonce de contrat orbital n'a été rendue publique.