Anthropic închiriază Colossus 1 pentru 1,25 miliarde USD/lună pe un parc xAI care atinge doar 11% din capacitate

Anthropic închiriază Colossus 1 pentru 1,25 miliarde USD/lună pe un parc xAI care atinge doar 11% din capacitate

În scurt : Anthropic închiriază supercomputerul Colossus 1 pentru 1,25 miliarde USD/lună, cu o utilizare de 11%, pentru a-și susține capacitatea de inferență Claude, în cadrul unui contract ce va dura până în 2029.

Anthropic tocmai a semnat un contract de 1,25 miliarde de dolari pe lună până în mai 2029, adică peste 40 de miliarde de dolari pe durata sa, pentru a rezerva un parc de GPU-uri despre care operatorul însuși a declarat, cu câteva săptămâni înainte, că rata sa efectivă de utilizare este „în mod evident scăzută” („embarrassingly low”), la 11%. În lumina veniturilor anualizate ale Anthropic din aprilie 2026 - peste 30 de miliarde de dolari, acest singur contract compute absoarbe aproximativ jumătate din ARR-ul editorului Claude, adică de aproximativ 6,3 ori angajamentul anual al OpenAI față de cei 11,9 miliarde de dolari încheiați cu CoreWeave pe cinci ani. Obiectul contractului: accesul exclusiv la întregul Colossus 1, supercomputerul din Memphis, Tennessee - peste 220,000 de GPU-uri Nvidia (H100, H200 și GB200), 300 megawați de putere și o disponibilitate în mai puțin de o lună, așa cum a documentat Business Insider pe 20 mai 2026 din S-1 SpaceX și confirmat de un purtător de cuvânt al Anthropic. O extindere la Colossus 2 este planificată. Efectele imediate anunțate asupra Claude Code: dublarea limitelor de debit pe 5 ore pentru abonamentele Pro, Max, Team și Enterprise, și eliminarea plafonului la orele de vârf pentru planurile Pro și Max.

Un parc construit de xAI, absorbit de SpaceX, acum închiriat unui concurent

Colossus 1 a fost conceput și operat inițial de xAI, compania de inteligență artificială a lui Elon Musk, înainte de achiziția sa de către SpaceX în cadrul fuziunii prin acțiuni care a avut loc în februarie 2026. ActuIA a urmărit încă din 2024 căutarea de putere de calcul a lui Musk pentru xAI care a pus presiune pe NVIDIA, un supercomputer conceput pentru sarcinile de antrenament ale Grok la scară parcului Nvidia H100/H200/GB200. Două elemente de context structurează prezentul contract. Pe de o parte, SpaceX a depus confidențial un S-1 la SEC pe 1 aprilie 2026 în vederea unei oferte publice inițiale vizând o evaluare între 1.750 și 2.000 miliarde de dolari, cu un roadshow planificat pentru săptămâna 8 iunie, potrivit CoinDesk. Pe de altă parte, Elon Musk a declarat pe rețeaua sa X că dorește să-și rezerve dreptul de a recupera capacitatea de calcul dacă IA de la Anthropic „ar iniția acțiuni care dăunează umanității” (traducere liberă); statutul contractual exact al acestei clauze nu a fost confirmat în comun de ambele părți. Contextul de exploatare este de asemenea documentat: memo-ul intern al xAI semnat de președintele său Michael Nicolls și obținut de Business Insider califică ca „în mod evident scăzută” o rată Model FLOPs Utilization (MFU) de 11% pe cele aproximativ 550,000 de GPU-uri Nvidia operate, acolo unde producția de antrenament LLM se situează între 35 și 45% MFU, Meta atingând 43% pe antrenamentul Llama 3, Google 46% pe PaLM, și MegaScale de ByteDance afișând 55,2% MFU pe 12,288 GPU-uri în timpul antrenării unui model de 175 miliarde de parametri, acest ultim rezultat fiind documentat în lucrarea arXiv publicată de ByteDance în februarie 2024.

Mecanica tarifară: o rezervare de capacitate, nu un tarif GPU pe oră

Trei precauții de lectură se impun înainte de orice comparație de preț. În primul rând, contractul nu este structurat ca un preț pe utilizare de GPU, ci ca o rezervare de 300 megawați de capacitate garantată: suma lunară remunerează disponibilitatea infrastructurii, independent de compute-ul efectiv livrat. Raportat la parcul de 220,000 de GPU-uri pe 720 de ore lunare, costul implicit pe GPU și pe oră ajunge la aproximativ 7,78 dolari conform estimării ActuIA. Pentru a situa acest ordin de mărime, IntuitionLabs notează că tarifele H100 la cerere la AWS și Google Cloud se situează în jur de 3 la 4 dolari pe GPU și pe oră, în timp ce neo-cloud-uri precum Lambda Labs, RunPod, Vast.ai sau Cudo Compute oferă tarife coborând la 1,49-2,99 dolari, AWS reducând prețurile H100 cu aproximativ 44% în iunie 2025. Comparația directă rămâne înșelătoare prin natura angajamentului: H100 on-demand (la cerere, facturare pe oră) este o variabilă de ajustare pe oră, contractul Colossus este un angajament de capacitate pe 36 de luni - două regimuri tarifare care nu se raportează la același obiect.

În al doilea rând, rata de 11% MFU se referă la antrenamentele Grok conduse de xAI, în timp ce Anthropic destinează aceste GPU-uri în principal inferenței Claude. Cele două regimuri nu sunt comparabile: antrenamentul este compute-bound (consumator de operațiuni în virgulă mobilă), inferența este în principal memory-bandwidth-bound (limitată de lățimea de bandă de memorie), iar metrica MFU nu este un indicator direct al eficienței unui workload de inferență. În al treilea rând, SpaceX a înregistrat, conform S-1, o pierdere operațională pe segmentul AI compute în primul trimestru 2026, al cărei ordin de mărime (aproximativ 2,5 miliarde de dolari pe trimestru, pentru o cifră de afaceri de segment de aproximativ 800 de milioane) plasează tariful lunar al Anthropic sub pragul de rentabilitate actual al operatorului: prețul consimțit reflectă o decizie strategică de sub-tarifare, nu un semnal de piață stabilizat. Extrapolarea anualizată din acest singur trimestru cere prudență, S-1 nepublicând o serie istorică consolidată.

Greutatea contractului pentru Anthropic și comparabilul OpenAI/CoreWeave

Angajamentul Colossus reprezintă aproximativ 15 miliarde de dolari pe an pe trei ani, de pus în raport cu traiectoria de venituri a Anthropic. Potrivit Los Angeles Times, venitul anualizat (ARR) al Anthropic s-a dublat de la vara 2025, depășind 9 miliarde de dolari la sfârșitul anului 2025, apoi 14 miliarde în februarie 2026, 19 miliarde în martie și peste 30 de miliarde de dolari în aprilie 2026 (Los Angeles Times). În lumina acestui ARR din aprilie, singurul contract Colossus mobilizează aproximativ jumătate din veniturile anualizate ale Anthropic - un raport fără echivalent recent pentru un acord de infrastructură izolat.

Cel mai imediat comparabil sectorial este acordul OpenAI/CoreWeave. Potrivit The Next Platform, OpenAI a încheiat un contract de cinci ani pentru 11,9 miliarde de dolari cu CoreWeave, care dispune de aproximativ 250,000 de GPU-uri repartizate în 32 de centre de date (The Next Platform, 11 martie 2025). Adică 2,38 miliarde de dolari pe an, față de 15 miliarde pentru Anthropic/SpaceX pe un parc de dimensiuni comparabile: angajamentul anual al editorului Claude este de ordinul 6,3 ori superior celui al OpenAI pe perimetrul neo-cloud public. O lectură financiară a contractului trebuie să integreze și inserția sa în calendarul ofertei publice SpaceX. Această combinație - capacitate subutilizată monetizată la un preț ridicat - întărește mecanic narațiunea de venituri a S-1, independent de randamentul efectiv al parcului.

Ce livrează Colossus pentru Anthropic, ce nu a livrat încă orbita

Pe perimetrul operațional imediat, Anthropic alocă capacitatea Colossus în principal inferenței Claude, un workload distinct de antrenament prin presiunea sa dominantă asupra lățimii de bandă de memorie și prin constrângerile sale de latență a utilizatorului. Extinderea anunțată la Colossus 2 inserează dispozitivul într-o traiectorie de creștere pe segmentul de inferență, în timp ce editorul Claude a văzut debitele sale de utilizator tensionate de mai multe ori în timpul vârfurilor de trafic Claude Code în 2025.

Al doilea aspect al anunțului, în schimb, nu are același statut. Anthropic a exprimat un interes pentru a dezvolta cu SpaceX mai mulți gigawați de capacitate de calcul AI în orbită, dar niciun contract nu a fost semnat până în prezent. MIT Technology Review documentează patru obstacole tehnice pentru un centru de date spațial la această scară. În vidul spațial, căldura poate fi evacuată doar prin radiație, un proces mult mai puțin eficient decât convecția; componentele electronice fac față la single-event upsets (perturbări logice induse de particule ionizante), la un prejudiciu cumulativ de ionizare și la daune prin deplasare, conform revistei MIT, care adaugă trei factori convergenți: temperatura în orbită nu ar scădea sub 80 °C (adică dincolo de intervalul operațional sigur al electronicii comerciale), componentele întărite spațial costă semnificativ mai mult și sunt cu câțiva ani în urma stării de artă, iar asamblarea orbitală la această scară ar necesita sisteme robotice care nu există. Proiectul ține, la data de 21 mai 2026, de registrul declarativ: nicio anunțare a unui contract orbital nu a fost făcută publică.