İçindekiler
Doubao ile ByteDance, günde 120 trilyon token işlediğini iddia ediyor. Bu ölçekte, donanım konusu artık sadece Nvidia GPU'larıyla sınırlı değil: Sunucu CPU'ları, uzun süre yapay zeka tartışmalarında arka planda kalmıştı, ancak şimdi stratejik bir değişken olarak geri dönüyor. Reuters'a göre, Çinli grup, yapay zeka ajanlarını Coze üzerinden dağıtımını desteklemek ve Intel ve AMD'ye bağımlılığını azaltmak için biri Arm, diğeri RISC-V tabanlı iki yerel işlemci ailesi geliştiriyor.
ByteDance endüstriyel bir eşiği aşmış olabilir. Mart 2026'da, Doubao günde 120 trilyon token işliyordu - anglo-Amerikan anlamında 120 trillion - Volcano Engine tarafından yayınlanan ve TechNode tarafından aktarılan rakamlara göre. Kullanım üç ayda iki katına çıkmış ve Mayıs 2024'te modelin halka açık lansmanından bu yana bin kat artmış durumda.
Bu trafik seviyesinde, çıkarım maliyeti artık sadece yapay zeka hızlandırıcılarının fiyatına bağlı değil. Sunucu yığını genelinde de etkilenir: CPU, bellek, orkestrasyon, araç çağrıları, veritabanı erişimi, ağ, kuyruklar, gecikme ve kullanılabilirlik. Bu bağlamda, Reuters 28 Mayıs 2026'da ByteDance'in iki yol izleyerek kendi merkezi işlemcilerini geliştirdiğini açıkladı: SoftBank'a ait Arm mimarisi ve açık bir talimat seti olan RISC-V mimarisi.
Program, grubun Coze üzerinden genişletilmiş yapay zeka ajanlarının dağıtımıyla ilişkili. Anlık motivasyonu, ekonomik olduğu kadar stratejik: Intel, Çinli müşterilerine bazı sunucu CPU'ları için altı aya kadar teslimat gecikmeleri bildirmiş, Reuters'a göre her çeyrekte %10 ila %35 arasında fiyat artışlarıyla. Bu nedenle ByteDance için mesele sadece "Amerikan hiperbüyüklükçüler gibi yapmak" değil, aynı zamanda büyük ölçekte kullanılan bir yapay zekanın donanım temelini güvence altına almak.
Yapay Zeka Mücadelesi Sadece GPU'larda Değil
Son iki yıldır, yapay zeka üzerine donanım tartışmaları Nvidia, Amerikan ihracat kısıtlamaları, H100/H200/B200 GPU'ları ve Huawei Ascend gibi Çin alternatiflerine odaklanmış durumda. Bu çerçeve gerekli ama eksik.
GPU'lar ve yapay zeka hızlandırıcıları büyük modellerin eğitimi ve en yoğun çıkarım yükleri için merkezde kalır. Ancak yapay zeka ajanları başka bir kısıt getirir. Bir ajan sadece tek geçişte uzun bir yanıt üretmekle kalmaz. Planlar, araçları çağırır, sonuçları kontrol eder, alt görevleri yeniden başlatır, belge veri tabanlarını tarar, kod çalıştırır, API'lerle etkileşime girer ve mantık döngülerini çoğaltır.
Bu tür bir yükte, sunucu CPU'su yeniden kritik hale gelir. Yapay zeka hızlandırıcısını değiştirmez, ancak çıkarımın toplam maliyetini belirler: çağrıların orkestrasyonu, bileşenler arası gecikme, oturum yönetimi, güvenlik, zamanlama, ön işleme, son işleme ve ajanlar tarafından çağrılan işlevlerin yürütülmesi.
ByteDance'in kontrol altına almak istediği katman budur. Reuters tarafından açıklanan proje, Nvidia'yı doğrudan yerel CPU'larla değiştirme girişimi olarak okunmamalıdır. Bu daha çok yapay zeka yüklerini çevreleyen sunucu temelinde dikey entegrasyon hareketi.
Çin Sunucu Pazarındaki Intel'in Payı Azalıyor
Bu değişim sadece ByteDance ile sınırlı değil. Business Times tarafından aktarılan Ocak 2026 tarihli UBS çalışmasına göre, Intel'in Çin'deki sunucu işlemcilerindeki pazar payı 2019'da %90'dan fazla iken 2025'te yaklaşık %60'a düşmüş durumda. Aynı dönemde, AMD'nin payı yaklaşık %5'ten %20'nin üzerine çıkmış durumda.
Bu gelişmenin iki sonucu var. İlk olarak, Intel artık Çin sunucusunda neredeyse tekel konumunda değil. İkincisi, büyük Çinli müşteriler artık daha güçlü bir teşvikle donanım yığınlarını çeşitlendirmeye yöneliyor, özellikle teslimat süreleri, fiyatlar ve jeopolitik kısıtlamalar aynı anda arttığında.
Çin, Intel'in toplam gelirinin %20'sinden fazlasını temsil ediyor. Ancak dördüncü ve beşinci nesil Xeon'ların kıtlığı, bu bağımlılığı yerel müşteriler için daha maliyetli hale getirdi. Bu bağlamda, ByteDance'in yerel CPU geliştirmesi daha geniş bir hareketin parçası: Arm, RISC-V veya yerli sağlayıcılardan gelen daha iyi kontrol edilen mimarilere doğru büyük Çinli editörlerin kademeli bir geçişi.
Program yine de henüz başlangıç aşamasında. ByteDance, donanım tasarım ekibini sadece 2022'de oluşturdu. Bu nedenle, Apple, Google, Amazon veya Microsoft'un sahip olduğu on beş ila yirmi yıllık çip geliştirme deneyimiyle karşılaştırıldığında sınırlı bir deneyime sahip.
Hiperbüyüklükçülerin Önceki Deneyimi: Trafik Eşiği, Yaptırımlara Basit Bir Tepki Değil
ByteDance'in hareketi, büyük Amerikan hiperbüyüklükçülerinin hareketini hatırlatıyor. Google, AWS ve Microsoft, yerel çiplerini yalnızca egemenlik veya stratejik iletişim nedenleriyle geliştirmedi. Trafik, maliyet veya performans eşiği, standart satın alma modelini yetersiz hale getirdiğinde bunu yaptılar.
Google'da, yapay zekaya adanmış bir hızlandırıcı geliştirme kararı, 2013'te bir iç projeksiyonun sesli aramanın veri merkezi hesaplama gereksinimlerini iki katına çıkarabileceğini gösterdiğinde tetiklendi. Arama motorunun dahili yükleri için tasarlanan TPU, daha sonra hızla geliştirilip dağıtıldı ve bazı iş yüklerinde çağdaş CPU ve GPU'lara göre büyük kazançlar sağladı.
AWS, Trainium ile GPU örnekleri karşısında eğitim maliyetini azaltmak için takip etti. Microsoft, önceki Arm nesline göre daha iyi bir fiyat/performans oranına sahip genel bulut yüklerini optimize etmek için Azure Cobalt 100, bir Arm CPU geliştirdi.
Ortak nokta çipin tam doğası değil. TPU ve Trainium yapay zeka hızlandırıcılarıdır; Cobalt 100 bir Arm CPU'dur; ByteDance projeleri Arm ve RISC-V CPU'ları üzerinedir. Ortak nokta daha derindedir: Bir aktör yeterli ölçeğe ulaştığında, standart piyasaya tamamen bağımlı olmak yerine kendi yüklerini optimize etmek için silikonunun bir kısmını içselleştirmeye çalışır.
ByteDance bu mantığa giriyor. Ancak durumu bir önemli noktada farklı: Amerikan hiperbüyüklükçüler, TSMC ve gelişmiş bir tedarik zincirine güvenebildiler. Gelecekteki ByteDance CPU'larının kurucusu açıklanmadı.
SMIC TSMC Değil: Yapısal Bir Hipotez, Sadece Bir Ayrıntı Değil
Kurucu, dosyanın büyük eksik noktası. Reuters, ByteDance'in gelecekteki CPU'larını kimin üreteceğini belirtmiyor. Bazı analistler, ihracat kısıtlamaları ve jeopolitik bağlam göz önünde bulundurulduğunda SMIC'i olası bir seçenek olarak öne sürüyorlar, ancak bu hipotez doğrulanmadı.
Yine de ekonomik hesaplamayı kökten değiştiriyor. Google, AWS veya Microsoft'un önceki deneyimleri, TSMC'nin en iyi üretim düğümlerine erişim kapasitesine dayanıyordu. ByteDance SMIC'e güvenmek zorunda kalırsa, verim, enerji yoğunluğu ve wafer başına maliyet farkı merkezi hale gelir.
Başka bir deyişle, dikey entegrasyon otomatik olarak bir kazanç sağlamaz. Ancak maliyet toplamı - tasarım, üretim, verim, tüketim, yazılım bakımı, üretim hacmi ve veri merkezi entegrasyonu - Intel veya AMD CPU alımına kıyasla düşük veya stratejik olarak tercih edilebilir hale geldiğinde anlamlıdır.
ByteDance'in motivasyonu bu nedenle hem savunmacı hem de saldırgan olabilir: tedarik güvenliğini sağlamak, Intel ve AMD'ye bağımlılığı azaltmak, CPU'yu dahili yüklerle uyarlamak, aynı zamanda kontrolü kazanmak için başlangıçta bir ek maliyeti kabul etmek.
Not edilmesi gereken: SMIC bir hipotezdir, kesin bir gerçek değil. Ancak bu hipotez doğrulanırsa, Amerikan hiperbüyüklükçülerle karşılaştırma oldukça dikkatli bir şekilde yapılmalıdır: Kendi çipini geliştirmek, dünya çapındaki en iyi üretim düğümlerine erişim olup olmadığına göre aynı kazançları sağlamaz.
Hibrit Bir Donanım Stratejisi, Batı Kilitlenmesinden Çıkış Değil
Yerel CPU geliştirmek, ByteDance'in batı donanım kilitlenmesinden çıktığı anlamına gelmez. Aksine, mevcut bilgiler çok daha hibrit bir strateji çizmektedir.
ByteDance, 2026 yatırım planını 200 milyar yuan'a, yani yaklaşık 29,4 milyar dolara, %25 artışla 160 milyar yuan'lık başlangıç bütçesine göre artırmış olabilir. Başlangıç planında 85 milyar yuan yapay zeka çiplerine yönlendirilmiş olabilir. Ancak revize edilen bütçenin ayrıntılı dağılımı kamuya açıklanmadı.
Bloomberg, Qualcomm'un ByteDance veri merkezlerine milyonlarca özel yapay zeka ASIC sağlamak için bir sözleşme kazandığını bildirdi. Grup, Huawei Ascend çiplerine de milyarlarca dolar ayırmaktadır. Nvidia, ihracat kısıtlamalarına rağmen büyük ölçekli ön eğitim yüklerinde zor yerini korumaktadır.
Bu kombinasyon, net bir kopuş fikrine aykırıdır. ByteDance, Nvidia, Huawei, Qualcomm, Arm, RISC-V ve kendi geliştirmeleri arasında seçim yapıyor gibi görünmüyor. Kullanıma göre çeşitli donanım katmanları arasında karar veriyor: eğitim, çıkarım, ajanlar, dahili bulut, kullanılabilirlik, maliyet, uyumluluk ve jeopolitik kısıtlamalar.
Strateji, kendi kendine yeterlilik arayışından çok bir sanayi sigortasına benziyor: Tek bir tedarikçiye, tek bir mimariye veya tek bir ihracat rejimine bağımlı olmamak.
Ajans Çıkarımı Hesabı Nasıl Değiştirir?
Dosyanın en önemli unsuru belki de en az dikkat çekici olanıdır: Ajanlık yapay zeka, maliyetin ağırlık merkezini kaydırır.
Klasik bir sohbet botunda, görünen maliyetin çoğu model ve çıkarımı çalıştıran hızlandırıcı ile ilgilidir. Ajanlık sisteminde, her yanıt bir eylem zincirini tetikleyebilir: planlama, araştırma, araç çağrısı, doğrulama, ara jenerasyon, yürütme, düzeltme, yeni istek ve nihai teslim.
Büyük ölçekte, bu döngüler sadece GPU tüketmez. Tüm altyapıyı harekete geçirir. CPU, görev başına maliyetin merkezi bir parçası haline gelir ve artık sadece bir sunucu emtiası değildir.
Bu, ByteDance'in durumunu ilginç kılıyor. Doubao ve Coze ile grup sadece sohbetleri değil, harekete geçebilen, hizmetleri organize edebilen ve makine-makine etkileşimlerini çoğaltabilen ajanlar için bir altyapı inşa etmeye çalışıyor. Bu seviyede, donanım optimizasyonu artık sadece ham performansı hedeflemiyor. Her ajan eyleminin marjinal maliyetini hedefliyor.
Kazanılması Gereken Bir Bahis
Proje yine de olgunlaşmaktan uzak. Rekabetçi bir sunucu CPU'su tasarlamak önemli bir donanım, yazılım ve endüstriyel uzmanlık gerektirir. Çekirdekleri geliştirmek veya uyarlamak, tüketimi optimize etmek, yazılım uyumluluğunu sağlamak, derleyicileri sürdürmek, üretim zincirini güvence altına almak, hacimleri garanti etmek ve dahili ekipleri yüklerini taşımaya ikna etmek gerekir.
Yerel silikonun büyük başarıları nadiren sadece çipe dayanır. Tam bir yığılmaya dayanır: donanım, düşük seviyeli yazılımlar, dahili çerçeveler, stabilize edilmiş iş yükleri, büyük hacimler ve maliyetleri birkaç yıl boyunca amorti etme kapasitesi.
ByteDance hacme sahip. Ayrıca belirgin bir ekonomik baskıya sahip. Ancak henüz bu kısıtlamaları Google, Amazon veya Microsoft'un maddi avantajına dönüştürebileceğini kanıtlamadı.
Proje, olduğu gibi okunmalıdır: sunucu CPU pazarında anlık bir devrim değil, stratejik bir sinyal. Ajanlık yapay zeka yük profillerini değiştirdikçe, büyük oyuncular artık standart bileşen satın almakla yetinemezler. Token başına maliyetlerini, kullanılabilirliklerini ve operasyonel bağımsızlıklarını belirleyen donanım katmanlarını kontrol etmeye çalışırlar.
Tam Maliyet Savaşı
ByteDance'in Arm ve RISC-V CPU geliştirmesi, çok büyük ölçekli yapay zeka sanayileşmesinde bir aşama işaret ediyor. Modellerin savaşı ve ardından GPU'ların savaşı sonrası, yeni bir savaş açılıyor: tam yürütme maliyeti savaşı.
Bu savaşta kazanan, sadece en iyi modele veya en iyi hızlandırıcıya sahip olan olmayacak. Kendi kullanımlarına göre donanım mimarisi, yazılım, orkestrasyon, tedarik ve birim maliyetleri hizalayan olacak.
ByteDance henüz bu bahsi kazanmamış olabilir. Ancak Doubao, Coze ve çıkarım hacimleriyle grup, bunu denemek için artık ekonomik bir nedeni var.
