Зміст
З Doubao, ByteDance стверджує, що обробляє 120 000 мільярдів токенів на день. На цьому рівні, апаратне забезпечення стає критичним питанням не тільки для GPU Nvidia: серверні процесори, які довго залишалися на другому плані в обговоренні штучного інтелекту, знову стають стратегічною змінною. Згідно з Reuters, китайська група розробляє дві сім'ї власних процесорів, одна з яких базується на Arm, а інша на RISC-V, для підтримки розгортання своїх ІІ-агентів через Coze та зменшення залежності від Intel та AMD.
ByteDance, ймовірно, досягла індустріального порогу. У березні 2026 року Doubao обробляв 120 000 мільярдів токенів на день - 120 трильйонів за англо-американським значенням, згідно з даними, опублікованими Volcano Engine та переданими TechNode. Використання, ймовірно, подвоїлося за три місяці і збільшилося в тисячу разів з моменту публічного запуску моделі в травні 2024 року.
На цьому рівні трафіку вартість інференції залежить не лише від ціни ІІ-акселераторів. Вона також залежить від усієї серверної архітектури: процесори, пам'ять, оркестрація, виклики інструментів, доступ до баз даних, мережа, черги, затримки та доступність. У цьому контексті Reuters розкрив, 28 травня 2026 року, що ByteDance розробляє власні центральні процесори за двома напрямками: одна архітектура Arm, що належить SoftBank, і одна архітектура RISC-V, з відкритим набором інструкцій.
Програма пов'язана з розширеним розгортанням ІІ-агентів через Coze, агентську платформу групи. Її безпосередня мотивація є як економічною, так і стратегічною: Intel повідомив своїх китайських клієнтів про затримки постачання, що сягають до шести місяців на деякі серверні процесори, з підвищенням цін на 10 до 35% щокварталу, згідно з Reuters. Для ByteDance, питання полягає не лише в тому, щоб "робити як американські хіперскейлери", але й в забезпеченні апаратної основи для ІІ, яка використовується в масштабах.
Битва за ІІ не обмежується лише GPU
Останні два роки апаратне обговорення щодо ІІ зосередилося на Nvidia, американських експортних обмеженнях, GPU H100/H200/B200 та китайських альтернатив як Huawei Ascend. Це визначення необхідне, але неповне.
GPU та ІІ-акселератори залишаються центральними для тренування великих моделей і для найінтенсивніших інференційних навантажень. Але ІІ-агенти вводять іншу умову. Агент не обмежується лише генеруванням довгої відповіді за один раз. Він планує, викликає інструменти, перевіряє результати, відновлює підзадачі, звертається до документальних баз, виконує код, взаємодіє з API та множить цикли мислення.
У цьому типі навантажень серверний процесор знову стає критичним. Він не замінює ІІ-акселератор, але визначає повну вартість інференції: оркестрацію викликів, затримки між компонентами, управління сесіями, безпеку, планування, попередню обробку, постобробку та виконання функцій, викликаних агентами.
Це той шар, який ByteDance, схоже, хоче взяти під контроль. Проект, розкритий Reuters, не слід читати як спробу безпосередньо замінити Nvidia на власні процесори. Це швидше рух до вертикальної інтеграції серверної основи, яка оточує ІІ-навантаження, зокрема агентні навантаження.
Китайський серверний ринок, що відходить від Intel
Зміна стосується не лише ByteDance. Згідно з дослідженням UBS за січень 2026 року, цитованим Business Times, частка ринку Intel на серверні процесори в Китаї знизилася з понад 90% у 2019 році до приблизно 60% у 2025 році. За той же період AMD зросла з приблизно 5% до понад 20%.
Ця еволюція має два наслідки. По-перше, Intel більше не є в ситуації майже монополії на китайському серверному ринку. По-друге, великі китайські клієнти тепер мають більший стимул диверсифікувати свою апаратну основу, особливо коли затримки, ціни та геополітичні обмеження зростають одночасно.
Китай становить понад 20% від загального доходу Intel. Але дефіцит на Xeon четвертого та п'ятого покоління зробив цю залежність більш витратною для місцевих клієнтів. У цьому контексті розробка власних процесорів від ByteDance є частиною ширшого руху: поступового переходу великих китайських видавців до архітектур, які краще контролюються, незалежно від того, чи є вони Arm, RISC-V або вироблені місцевими постачальниками.
Проте програма залишається на початковій стадії. ByteDance сформувала свою команду з розробки апаратного забезпечення лише у 2022 році. Група має обмежений досвід у порівнянні з Apple, Google, Amazon або Microsoft, які накопичують навички, необхідні для розробки власних чіпів, вже протягом п'ятнадцяти-двадцяти років.
Прецедент гіперскейлерів: поріг трафіку, а не просто реакція на санкції
Рух ByteDance нагадує рух великих американських гіперскейлерів. Google, AWS і Microsoft не розробляли свої чіпи лише з причин суверенітету або стратегічної комунікації. Вони зробили це, коли поріг трафіку, вартості або продуктивності зробив стандартну модель закупівлі недостатньою.
У Google рішення розробити спеціальний акселератор для ІІ було ухвалено у 2013 році, коли внутрішня проекція показала, що голосовий пошук може вдвічі збільшити потреби в обчисленнях центрів обробки даних. TPU, розроблений для внутрішніх навантажень пошукової системи, був швидко розроблений і розгорнутий із масивними виграшами в порівнянні з сучасними процесорами та графічними процесорами на деяких навантаженнях.
AWS слідував із Trainium, призначеним для зниження вартості тренування у порівнянні з графічними інстанціями. Microsoft загальнозастосовував Azure Cobalt 100, власний процесор Arm, призначений для оптимізації загальних хмарних навантажень, з кращим співвідношенням ціни/продуктивності, ніж попереднє покоління Arm.
Спільне не є точною природою чіпа. TPU і Trainium є ІІ-акселераторами; Cobalt 100 є процесором Arm; проекти ByteDance стосуються процесорів Arm та RISC-V. Глибше спільне: коли актор досягає достатньої масштаби, він прагне внутрішньо контролювати частину свого кремнію, щоб оптимізувати власні навантаження, а не повністю залежати від стандартного ринку.
ByteDance входить у цю логіку. Але його випадок відрізняється за одним важливим моментом: американські гіперскейлери могли покладатися на TSMC і на розвинений ланцюг постачання. Виробник майбутніх процесорів ByteDance не був оголошений.
SMIC не є TSMC: структурна гіпотеза, а не деталь
Виробник є великим сліпим кутом у справі. Reuters не уточнює, хто б виробляв майбутні процесори ByteDance. Деякі аналітики називають SMIC як ймовірний варіант, враховуючи експортні обмеження та геополітичний контекст, але ця гіпотеза не підтверджена.
Вона радикально змінює економічний розрахунок. Попередні Google, AWS або Microsoft базуються на здатності доступу до найкращих вузлів виробництва TSMC. Якщо ByteDance доведеться спиратися на SMIC, різниця у врожайності, енергетичній щільності та вартості за пластину стане центральною.
Інакше кажучи, вертикальна інтеграція не гарантує автоматично виграш. Вона має сенс лише якщо загальна вартість - розробка, виробництво, врожайність, споживання, програмне обслуговування, обсяг виробництва та інтеграція у центрі обробки даних - стає нижчою або стратегічно переважнішою, ніж закупівля процесорів Intel або AMD.
У випадку ByteDance мотивація може бути як захисною, так і наступальною: забезпечення постачання, зменшення залежності від Intel та AMD, адаптація процесора до внутрішніх навантажень, але також прийняття початкових витрат для отримання контролю на тривалий період.
Слід зазначити: SMIC залишається гіпотезою, а не встановленим фактом. Але якщо ця гіпотеза підтвердиться, порівняння з американськими гіперскейлерами доведеться сильно відтінити: розробка власного чіпа не приносить однакових виграшів залежно від того, чи є доступ до найкращих вузлів виробництва у світі.
Гібридна апаратна стратегія, а не вихід з західного блокування
Розробка власних процесорів не означає, що ByteDance виходить з західного апаратного блокування. Навпаки, доступні дані вказують на набагато більш гібридну стратегію.
ByteDance підвищила свій інвестиційний план на 2026 рік до 200 мільярдів юанів, що становить приблизно 29,4 мільярда доларів, що на 25% більше від початкового бюджету у 160 мільярдів. У початковому плані 85 мільярдів юанів було спрямовано на ІІ-чіпи. Але детальна розподілка переглянутого бюджету не була оприлюднена.
Паралельно, Bloomberg повідомила, що Qualcomm отримала контракт на постачання мільйонів кастомізованих ІІ-ASIC до центрів обробки даних ByteDance. Група також виділяє кілька мільярдів доларів на чіпи Huawei Ascend. Nvidia залишається важкою для заміни у великих масштабних передтренувальних навантаженнях, незважаючи на експортні обмеження.
Ця комбінація суперечить ідеї чіткого розриву. ByteDance, схоже, не обирає між Nvidia, Huawei, Qualcomm, Arm, RISC-V та своїми розробками. Вона балансує між кількома апаратними шарами в залежності від використання: тренування, інференція, агенти, внутрішній хмарний облік, доступність, вартість, відповідність та геополітичні обмеження.
Стратегія більше схожа на промислове страхування: більше не залежати від одного постачальника, однієї архітектури чи одного режиму експорту.
Чому агентна інференція змінює розрахунок
Можливо, найважливіший елемент у справі є найменш вражаючим: агентна ІІ зміщує центр тяжкості витрат.
У класичному чатботі основна частина видимих витрат пов'язана з моделлю та акселератором, який виконує інференцію. У агентній системі кожна відповідь може запускати ланцюжок дій: планування, пошук, виклик інструменту, перевірка, проміжне генерування, виконання, корекція, новий запит та фінальне відновлення.
У великому масштабі ці цикли споживають не лише GPU. Вони мобілізують всю інфраструктуру. Процесор стає тоді центральною частиною вартості за завдання, а не просто серверною комодиті.
Це робить випадок ByteDance цікавим. З Doubao та Coze, група не лише намагається обслуговувати розмови. Вона будує інфраструктуру для агентів, здатних діяти, оркеструвати сервіси та множити взаємодії машина-машина. На цьому рівні апаратна оптимізація не прагне лише до грубої продуктивності. Вона прагне до граничної вартості кожної агентної дії.
Парі, ще далеке від виграшу
Проте проект ще далеко від зрілості. Розробка конкурентоспроможного серверного процесора вимагає значної апаратної, програмної та промислової експертизи. Потрібно розробити або адаптувати ядра, оптимізувати споживання, забезпечити програмну сумісність, підтримувати компілятори, забезпечити ланцюг виробництва, гарантувати обсяги та переконати внутрішні команди мігрувати свої навантаження.
Великі успіхи власного кремнію рідко ґрунтуються лише на чіпі. Вони ґрунтуються на повному стеку: апаратному забезпеченні, низькорівневих програмних засобах, внутрішніх фреймворках, стабільних навантаженнях, великих обсягах та здатності амортизувати витрати протягом кількох років.
ByteDance має обсяг. Вона також має очевидний економічний тиск. Але вона ще не продемонструвала, що може перетворити ці обмеження на матеріальні переваги, порівнянні з Google, Amazon чи Microsoft.
Проект слід читати за тим, чим він є: не як негайна революція на ринку серверних процесорів, а як стратегічний сигнал. Оскільки агентна ІІ змінює профілі навантажень, великі гравці більше не можуть задовольнитися купівлею стандартних компонентів. Вони прагнуть контролювати апаратні шари, що визначають їхні витрати на токен, доступність та операційну незалежність.
Битва за повну вартість
Розробка процесорів Arm та RISC-V від ByteDance знаменує етап у індустріалізації ІІ в дуже великому масштабі. Після битви за моделі, а потім за GPU, відкривається ще одна битва: за повну вартість виконання.
У цій битві переможець не буде лише тим, хто матиме найкращу модель або найкращий акселератор. Це буде той, хто зможе вирівняти апаратну архітектуру, програмне забезпечення, оркестрацію, постачання та одиничні витрати на власні потреби.
ByteDance ще не виграла це парі. Але з Doubao, Coze та своїми обсягами інференції, група тепер має економічну причину спробувати.
