Sommario
Anthropic ha appena firmato un contratto da 1,25 miliardi di dollari al mese fino a maggio 2029, ovvero oltre 40 miliardi di dollari nel periodo, per riservare un parco di GPU di cui l'operatore stesso aveva qualificato, poche settimane prima, il tasso di utilizzo effettivo come «manifestamente basso» («embarrassingly low»), all'11%. Alla luce dei ricavi annualizzati di Anthropic nell'aprile 2026 - oltre 30 miliardi di dollari, questo solo contratto assorbe circa la metà dell'ARR dell'editore di Claude, cioè circa 6,3 volte l'impegno annuale di OpenAI sui 11,9 miliardi di dollari conclusi con CoreWeave in cinque anni. Oggetto del contratto: l'accesso esclusivo all'intero Colossus 1, il supercomputer di Memphis, nel Tennessee - oltre 220.000 GPU Nvidia (H100, H200 e GB200), 300 megawatt di potenza e disponibilità in meno di un mese, come documentato da Business Insider il 20 maggio 2026 dal S-1 SpaceX e confermato da un portavoce di Anthropic. È prevista un'estensione a Colossus 2. Effetti immediati annunciati su Claude Code: raddoppio dei limiti di velocità su 5 ore per gli abbonamenti Pro, Max, Team e Enterprise, e rimozione del limite nelle ore di punta per i piani Pro e Max.
Un parco costruito da xAI, assorbito da SpaceX, ora affittato a un concorrente
Colossus 1 è stato concepito e operato inizialmente da xAI, la società di intelligenza artificiale di Elon Musk, prima della sua acquisizione da parte di SpaceX durante la fusione azionaria avvenuta nel febbraio 2026. ActuIA aveva seguito già nel 2024 la ricerca di potenza di calcolo di Musk per xAI che ha messo sotto pressione NVIDIA, un supercomputer concepito per i carichi di allenamento di Grok alla scala del parco Nvidia H100/H200/GB200. Due elementi contestuali strutturano il presente contratto. Da una parte, SpaceX ha depositato confidenzialmente un S-1 presso la SEC il 1° aprile 2026 in vista di un'offerta pubblica iniziale mirante una valutazione compresa tra 1.750 e 2.000 miliardi di dollari, con un roadshow previsto per la settimana dell'8 giugno, secondo CoinDesk. D'altra parte, Elon Musk ha dichiarato sul suo social X di voler riservarsi il diritto di recuperare la capacità di calcolo se l'IA di Anthropic «intraprendesse azioni che danneggiano l'umanità» (traduzione libera); lo status contrattuale esatto di questa clausola non è stato oggetto di una conferma congiunta delle due parti. Il contesto operativo è anch'esso documentato: il memo interno di xAI firmato dal suo presidente Michael Nicolls e ottenuto da Business Insider qualifica come «manifestamente basso» un tasso di Model FLOPs Utilization (MFU) dell'11% sui circa 550.000 GPU Nvidia operati, dove la produzione-grade dell'allenamento LLM si situa tra il 35 e il 45% di MFU, Meta raggiungendo il 43% sull'allenamento di Llama 3, Google il 46% su PaLM, e MegaScale di ByteDance mostrando il 55,2% di MFU su 12.288 GPU durante l'allenamento di un modello di 175 miliardi di parametri, quest'ultimo risultato documentato nel paper arXiv pubblicato da ByteDance nel febbraio 2024.
Meccanica tariffaria: una prenotazione di capacità, non una tariffa GPU all'ora
Tre precauzioni di lettura si impongono prima di qualsiasi confronto di prezzi. In primo luogo, il contratto non è strutturato come un prezzo all'uso per GPU ma come una prenotazione di 300 megawatt di capacità garantita: l'importo mensile remunera la disponibilità dell'infrastruttura, indipendentemente dal compute effettivamente consegnato. Rapportato al parco di 220.000 GPU su 720 ore mensili, il costo implicito per GPU e per ora risulta di circa 7,78 dollari secondo la stima ActuIA. Per situare questo ordine di grandezza, IntuitionLabs rileva che le tariffe H100 su richiesta presso AWS e Google Cloud si situano intorno ai 3-4 dollari per GPU e per ora, mentre neo-cloud come Lambda Labs, RunPod, Vast.ai o Cudo Compute offrono tariffe che scendono a 1,49–2,99 dollari, AWS avendo abbassato i suoi prezzi H100 di circa il 44% nel giugno 2025. Il confronto diretto resta insidioso per la natura dell'impegno: l'H100 on-demand (su richiesta, fatturazione oraria) è una variabile di aggiustamento oraria, il contratto Colossus è un impegno di capacità su 36 mesi - due regimi tariffari che non si riferiscono allo stesso oggetto.
In secondo luogo, il tasso dell'11% di MFU riguarda gli allenamenti Grok condotti da xAI, mentre Anthropic destina queste GPU principalmente all'inferenza Claude. I due regimi non sono comparabili: l'allenamento è compute-bound (goloso di operazioni in virgola mobile), l'inferenza è principalmente memory-bandwidth-bound (limitata dalla larghezza di banda della memoria), e la metrica MFU non è un indicatore diretto dell'efficienza di un workload di inferenza. In terzo luogo, SpaceX ha registrato, secondo il suo S-1, una perdita operativa sul segmento AI compute nel primo trimestre 2026, il cui ordine di grandezza (circa 2,5 miliardi di dollari sul trimestre, per un fatturato di segmento dell'ordine di 800 milioni) colloca la tariffa mensile di Anthropic al di sotto della soglia di redditività attuale dell'operatore: il prezzo concesso riflette una decisione strategica di sotto-tariffazione, non un segnale di mercato stabilizzato. L'extrapolazione annualizzata a partire da questo solo trimestre richiede prudenza, il S-1 non pubblicando una serie storica consolidata.
Il peso del contratto per Anthropic e confronto OpenAI/CoreWeave
L'impegno Colossus rappresenta circa 15 miliardi di dollari all'anno su tre anni, da mettere in relazione con la traiettoria di ricavi di Anthropic. Secondo il Los Angeles Times, il ricavo annualizzato (ARR) di Anthropic è più che raddoppiato dall'estate 2025, superando 9 miliardi di dollari entro la fine del 2025, poi 14 miliardi a febbraio 2026, 19 miliardi a marzo e oltre 30 miliardi di dollari in aprile 2026 (Los Angeles Times). Alla luce di questo ARR di aprile, il solo contratto Colossus mobilita circa la metà dei ricavi annualizzati di Anthropic - un rapporto senza equivalente recente per un accordo di infrastruttura isolato.
Il confronto settoriale più immediato è l'accordo OpenAI/CoreWeave. Secondo The Next Platform, OpenAI ha concluso un contratto di cinque anni per 11,9 miliardi di dollari con CoreWeave, che dispone di circa 250.000 GPU distribuiti in 32 datacenter (The Next Platform, 11 marzo 2025). Ovvero 2,38 miliardi di dollari all'anno, contro 15 miliardi per Anthropic/SpaceX su un parco di dimensioni comparabili: l'impegno annuale dell'editore di Claude è dell'ordine di 6,3 volte superiore a quello di OpenAI sul perimetro neo-cloud pubblico. Una lettura finanziaria del contratto deve anche integrare la sua inclusione nel calendario dell'offerta pubblica iniziale SpaceX. Questa combinazione - capacità sotto-utilizzata monetizzata a tasso elevato - rafforza meccanicamente il racconto dei ricavi del S-1, indipendentemente dal rendimento effettivo del parco.
Cosa Colossus consegna ad Anthropic, cosa l'orbita non ha ancora consegnato
Sul perimetro operativo immediato, Anthropic destina la capacità Colossus principalmente all'inferenza Claude, un workload distinto dall'allenamento per la sua pressione dominante sulla larghezza di banda della memoria e per i suoi vincoli di latenza utente. L'estensione annunciata a Colossus 2 iscrive il dispositivo in una traiettoria di aumento del carico sul segmento inferenza, mentre l'editore di Claude ha visto i suoi tassi di utilizzo utente tesi in più occasioni durante i picchi di traffico Claude Code nel 2025.
Il secondo aspetto dell'annuncio, tuttavia, non ha lo stesso status. Anthropic ha espresso un interesse per sviluppare con SpaceX diversi gigawatt di capacità di calcolo IA in orbita, ma nessun contratto è stato firmato a questo stadio. MIT Technology Review documenta quattro ostacoli tecnici a un datacenter spaziale a questa scala. Nel vuoto spaziale, il calore può essere dissipato solo per irraggiamento, un processo notevolmente meno efficiente della convezione; i componenti elettronici affrontano single-event upsets (perturbazioni logiche indotte da particelle ionizzanti), danni cumulativi di ionizzazione e danni da spostamento, secondo la rivista del MIT, che aggiunge tre fattori convergenti: la temperatura in orbita non scenderebbe sotto gli 80 °C (ossia oltre il range operativo sicuro dell'elettronica commerciale), i componenti rinforzati spazialmente costano notevolmente di più e accusano diversi anni di ritardo rispetto allo stato dell'arte, e l'assemblaggio orbitale a questa scala richiederebbe sistemi robotici che non esistono. Il progetto rientra, alla data del 21 maggio 2026, nel registro dichiarativo: nessuna annuncio di contratto orbitale è stata resa pubblica.