ByteDance przygotowuje własne procesory CPU Arm i RISC-V, aby odzyskać kontrolę nad kosztami na token

Z Doubao, ByteDance twierdzi, że przetwarza 120 000 miliardów tokenów dziennie. Na taką skalę, wyzwanie sprzętowe nie ogranicza się już do GPU Nvidia: serwerowe CPU, długo pomijane w debacie o AI, ponownie stają się strategicznym czynnikiem. Według Reuters, chińska grupa rozwija dwie rodziny procesorów własnej produkcji, jedną opartą na Arm, drugą na RISC-V, aby wspierać wdrażanie swoich agentów AI przez Coze i zmniejszyć zależność od Intel i AMD.

ByteDance osiągnął próg przemysłowy. W marcu 2026 roku Doubao przetwarzał 120 000 miliardów tokenów dziennie - 120 trillionów w sensie anglo-amerykańskim - według danych opublikowanych przez Volcano Engine i przekazanych przez TechNode. Użycie wzrosło dwukrotnie w ciągu trzech miesięcy i tysiąckrotnie od publicznego uruchomienia modelu w maju 2024 roku.

Na tym poziomie ruchu, koszt inferencji nie zależy już tylko od ceny akceleratorów AI. Zależy także od całej stosu serwerowego: CPU, pamięci, orkiestracji, wywołań narzędzi, dostępu do baz danych, sieci, kolejek, opóźnień i dostępności. W tym kontekście Reuters ujawnił 28 maja 2026 roku, że ByteDance rozwija własne procesory centralne według dwóch ścieżek: architektury Arm, której właścicielem jest SoftBank, oraz architektury RISC-V, otwartego zestawu instrukcji.

Program związany jest z rozszerzonym wdrożeniem agentów AI przez Coze, platformę agentową grupy. Jego natychmiastową motywacją jest zarówno ekonomiczna, jak i strategiczna: Intel miałby powiadomić swoich chińskich klientów o opóźnieniach w dostawach sięgających do sześciu miesięcy na niektóre serwerowe CPU, z podwyżkami cen od 10 do 35% na kwartał według Reuters. Dla ByteDance wyzwanie nie polega zatem tylko na „robieniu jak amerykańscy hyperskalerzy”, ale na zabezpieczeniu sprzętowej podstawy AI używanej na masową skalę.

Bitwa AI nie rozgrywa się tylko na GPU

Od dwóch lat debata sprzętowa na temat AI koncentruje się na Nvidia, amerykańskich ograniczeniach eksportowych, GPU H100/H200/B200 i chińskich alternatywach jak Huawei Ascend. To ujęcie jest konieczne, ale niekompletne.

GPU i akceleratory AI pozostają kluczowe dla trenowania dużych modeli i obciążeń inferencyjnych o największej intensywności. Ale agenci AI wprowadzają inne ograniczenie. Agent nie ogranicza się do generowania długiej odpowiedzi w jednym przejściu. Planuje, wywołuje narzędzia, weryfikuje wyniki, ponawia zadania, konsultuje bazy dokumentacyjne, wykonuje kod, współdziała z API i mnoży pętle rozumowania.

W takim typie obciążenia serwerowy CPU ponownie staje się krytyczny. Nie zastępuje akceleratora AI, ale warunkuje całkowity koszt inferencji: orkiestracja wywołań, opóźnienia między komponentami, zarządzanie sesjami, bezpieczeństwo, harmonogramowanie, przetwarzanie wstępne, przetwarzanie końcowe i wykonywanie funkcji wywoływanych przez agentów.

To tę warstwę ByteDance zdaje się chcieć wziąć pod kontrolę. Projekt ujawniony przez Reuters nie powinien być zatem odczytywany jako próba bezpośredniego zastąpienia Nvidia własnymi CPU. To raczej ruch integracji pionowej na podstawie serwera otaczającego obciążenia AI, szczególnie obciążenia agentowe.

Chiński rynek serwerowy oddala się od Intel

Zmiana dotyczy nie tylko ByteDance. Według badania UBS z stycznia 2026 roku cytowanego przez Business Times, udział Intel w rynku procesorów serwerowych w Chinach spadł z ponad 90% w 2019 roku do około 60% w 2025 roku. W tym samym okresie AMD wzrosło z około 5% do ponad 20%.

Ta ewolucja ma dwa skutki. Po pierwsze, Intel nie jest już w quasi-monopolistycznej pozycji na chińskim rynku serwerowym. Po drugie, chińscy wielcy klienci mają teraz silniejszą motywację do dywersyfikacji swojego stosu sprzętowego, szczególnie gdy jednocześnie rosną opóźnienia, ceny i ograniczenia geopolityczne.

Chiny stanowią ponad 20% całkowitych przychodów Intela. Ale niedobór procesorów Xeon czwartej i piątej generacji uczynił tę zależność bardziej kosztowną dla lokalnych klientów. W tym kontekście rozwój własnych procesorów przez ByteDance wpisuje się w szerszy ruch: stopniowej migracji chińskich wielkich wydawców do lepiej kontrolowanych architektur, czy to Arm, RISC-V, czy pochodzących od krajowych dostawców.

Program pozostaje jednak w fazie zalążkowej. ByteDance utworzył swój zespół projektowy sprzętu dopiero w 2022 roku. Grupa ma zatem ograniczone doświadczenie w porównaniu do Apple, Google, Amazon lub Microsoft, które od piętnastu do dwudziestu lat gromadzą niezbędne umiejętności do rozwoju własnych chipów.

Poprzednik hyperskalerów: próg ruchu, nie tylko reakcja na sankcje

Ruch ByteDance przypomina ten amerykańskich hyperskalerów. Google, AWS i Microsoft nie rozwijali swoich własnych chipów tylko z powodów suwerenności czy komunikacji strategicznej. Zrobili to, gdy próg ruchu, kosztów lub wydajności uczynił standardowy model zakupów niewystarczającym.

W Google decyzja o opracowaniu dedykowanego akceleratora AI została podjęta w 2013 roku, gdy wewnętrzna prognoza pokazała, że wyszukiwanie głosowe może podwoić potrzeby obliczeniowe centrów danych. TPU, zaprojektowany dla wewnętrznych obciążeń silnika, został następnie szybko rozwinięty i wdrożony, przynosząc ogromne korzyści względem ówczesnych CPU i GPU na pewnych zadaniach.

AWS poszedł w ślad za Trainium, zaprojektowanym w celu obniżenia kosztów szkolenia w porównaniu z instancjami GPU. Microsoft uogólnił Azure Cobalt 100, własny CPU Arm przeznaczony do optymalizacji ogólnych obciążeń chmurowych, z lepszym stosunkiem cena/wydajność niż poprzednia generacja Arm.

Wspólnym punktem nie jest więc dokładna natura chipu. TPU i Trainium to akceleratory AI; Cobalt 100 to CPU Arm; projekty ByteDance dotyczą procesorów CPU Arm i RISC-V. Wspólnym punktem jest głębszy aspekt: gdy gracz osiąga wystarczającą skalę, dąży do internalizacji części swojego krzemu, aby optymalizować własne obciążenia, zamiast polegać całkowicie na standardowym rynku.

ByteDance wchodzi w tę logikę. Ale jego przypadek różni się pod jednym istotnym punktem: amerykańscy hyperskalerzy mogli oprzeć się na TSMC i zaawansowanym łańcuchu dostaw. Producent przyszłych CPU ByteDance nie został ogłoszony.

SMIC to nie TSMC: strukturalna hipoteza, nie szczegół

Producent jest wielkim ślepym punktem w sprawie. Reuters nie precyzuje, kto produkowałby przyszłe CPU dla ByteDance. Niektórzy analitycy wskazują SMIC jako prawdopodobną opcję, biorąc pod uwagę ograniczenia eksportowe i kontekst geopolityczny, ale ta hipoteza nie jest potwierdzona.

Jednak zmienia ona radykalnie kalkulację ekonomiczną. Przykłady Google, AWS czy Microsoft opierają się na zdolności dostępu do najlepszych węzłów produkcyjnych TSMC. Jeśli ByteDance musiałby oprzeć się na SMIC, różnica w wydajności, gęstości energetycznej i kosztach na wafel stałaby się kluczowa.

Innymi słowy, integracja pionowa nie gwarantuje automatycznie zysku. Ma sens tylko wtedy, gdy całkowity koszt - projektowanie, produkcja, wydajność, zużycie energii, konserwacja oprogramowania, wielkość produkcji i integracja centrów danych - staje się niższy lub strategicznie preferowany od zakupu CPU Intel lub AMD.

W przypadku ByteDance motywacja może być zarówno defensywna, jak i ofensywna: zabezpieczenie dostaw, zmniejszenie zależności od Intel i AMD, dostosowanie CPU do wewnętrznych obciążeń, ale także akceptacja początkowego nadwyżki kosztów, aby zyskać kontrolę na dłuższą metę.

Warto zapamiętać: SMIC pozostaje hipotezą, a nie ustalonym faktem. Ale jeśli ta hipoteza się potwierdzi, porównanie z amerykańskimi hyperskalerami będzie musiało zostać mocno zniuansowane: rozwijanie własnego chipu nie przynosi tych samych zysków, w zależności od tego, czy ma się dostęp do najlepszych węzłów produkcyjnych na świecie, czy nie.

Strategia sprzętowa hybrydowa, nie wyjście z zachodniego zamknięcia

Rozwój własnych CPU nie oznacza, że ByteDance wychodzi z zachodniego zamknięcia sprzętowego. Wręcz przeciwnie, dostępne informacje rysują znacznie bardziej hybrydową strategię.

ByteDance miałby zwiększyć swój plan inwestycyjny na 2026 rok do 200 miliardów juanów, czyli około 29,4 miliardów dolarów, co oznacza wzrost o 25% w porównaniu z początkową kwotą 160 miliardów. W początkowym planie 85 miliardów juanów miało być przeznaczone na chipy AI. Jednak szczegółowy podział zrewidowanej kwoty nie został podany do publicznej wiadomości.

Równocześnie, Bloomberg poinformował, że Qualcomm miałby zdobyć kontrakt na dostarczenie milionów niestandardowych ASIC AI do centrów danych ByteDance. Grupa miałaby również przeznaczyć kilka miliardów dolarów na chipy Huawei Ascend. Jednak Nvidia pozostawałaby trudna do zastąpienia w dużych obciążeniach przedtreningowych, mimo ograniczeń eksportowych.

Ta kombinacja przeczy idei wyraźnego zerwania. ByteDance nie wydaje się wybierać między Nvidia, Huawei, Qualcomm, Arm, RISC-V a własnymi rozwinięciami. Podejmuje decyzje między różnymi warstwami sprzętowymi w zależności od zastosowań: trening, inferencja, agenci, chmura wewnętrzna, dostępność, koszt, zgodność i ograniczenia geopolityczne.

Strategia wydaje się mniej poszukiwaniem autarkii, a bardziej ubezpieczeniem przemysłowym: nie polegać już na jednym dostawcy, ani jednej architekturze, ani jednym reżimie eksportowym.

Dlaczego inferencja agentowa zmienia kalkulację

Najważniejszym elementem w sprawie jest być może najmniej spektakularny: AI agentowa przesuwa środek ciężkości kosztów.

W klasycznym chatbotie, zasadnicza część widocznych kosztów związana jest z modelem i akceleratorem wykonującym inferencję. W systemie agentowym każda odpowiedź może wywołać łańcuch działań: planowanie, wyszukiwanie, wywołanie narzędzia, weryfikacja, generowanie pośrednie, wykonanie, korekta, nowe zapytanie i ostateczna odpowiedź.

Na dużą skalę, te pętle nie zużywają tylko GPU. Mobilizują całe zaplecze infrastrukturalne. CPU staje się wtedy centralnym elementem kosztu na zadanie, a nie tylko serwerową komoditą.

To sprawia, że przypadek ByteDance jest interesujący. Z Doubao i Coze, grupa nie szuka tylko obsługi rozmów. Buduje infrastrukturę dla agentów zdolnych do działania, orkiestracji usług i mnożenia interakcji maszyna-maszyna. Na tym poziomie optymalizacja sprzętowa nie dotyczy już tylko surowej wydajności. Dotyczy marginalnego kosztu każdej akcji agentowej.

Zakład jeszcze daleki od wygranej

Projekt jest jednak wciąż daleki od dojrzałości. Zaprojektowanie konkurencyjnego serwerowego CPU wymaga znacznej wiedzy sprzętowej, programistycznej i przemysłowej. Trzeba rozwijać lub dostosowywać rdzenie, optymalizować zużycie energii, zapewniać zgodność oprogramowania, utrzymywać kompilatory, zabezpieczać łańcuch produkcyjny, gwarantować wielkości i przekonać wewnętrzne zespoły do migracji swoich obciążeń.

Wielkie sukcesy krzemu własnej produkcji rzadko opierają się tylko na samym chipie. Opierają się na pełnym stosie: sprzęcie, oprogramowaniu niskopoziomowym, wewnętrznych ramach, ustabilizowanych obciążeniach, masowych wolumenach i zdolności do amortyzacji kosztów na przestrzeni lat.

ByteDance posiada wolumen. Posiada również oczywistą presję ekonomiczną. Ale nie udowodnił jeszcze, że może przekształcić te ograniczenia w materialną przewagę porównywalną z Google, Amazon czy Microsoft.

Projekt powinien być zatem odczytywany w takim kontekście, jaki jest: nie jako natychmiastowa rewolucja na rynku serwerowych CPU, ale jako sygnał strategiczny. W miarę jak AI agentowa zmienia profile obciążeń, wielcy gracze nie mogą już zadowalać się kupowaniem standardowych komponentów. Dążą do kontrolowania warstw sprzętowych, które determinują ich koszt na token, dostępność i operacyjną niezależność.

Bitwa o pełny koszt

Rozwój CPU Arm i RISC-V przez ByteDance oznacza krok w industrializacji AI na bardzo dużą skalę. Po bitwie modeli, a następnie GPU, otwiera się kolejna bitwa: o pełny koszt wykonania.

W tej bitwie zwycięzcą nie będzie tylko ten, kto będzie miał najlepszy model lub najlepszy akcelerator. Będzie to ten, kto potrafi zgrać architekturę sprzętową, oprogramowanie, orkiestrację, zaopatrzenie i jednostkowe koszty z własnymi zastosowaniami.

ByteDance jeszcze nie wygrał tego zakładu. Ale z Doubao, Coze i swoimi wolumenami inferencyjnymi, grupa ma teraz ekonomiczny powód, by spróbować.