ByteDance、トークンコストの制御を取り戻すために独自のArmおよびRISC-V CPUを準備中

ByteDanceはDoubaoを使用して1日に120,000兆のトークンを処理していると主張しています。この規模では、ハードウェアの課題はNvidiaのGPUに限られません。長い間AIの議論で二次的な役割を果たしてきたサーバーCPUが、戦略的な変数として再び浮上しています。Reutersによると、中国のグループは、自社のAIエージェントをCozeを通じて展開し、IntelやAMDへの依存を減らすために、ArmベースとRISC-Vベースの2つのプロセッサファミリーを開発しています。

ByteDanceは産業的な段階に達したようです。2026年3月に、Doubaoは1日に120,000兆のトークンを処理しました（英米式の120トリリオン）と、Volcano Engineが公表し、TechNodeが報じています。使用量は3か月で倍増し、2024年5月のモデルの一般公開以来、1,000倍に増えました。

このレベルのトラフィックでは、推論のコストはIAアクセラレーターの価格だけに依存しません。サーバースタック全体、つまりCPU、メモリ、オーケストレーション、ツール呼び出し、データベースアクセス、ネットワーク、キュー、レイテンシー、可用性にも依存します。この文脈で、2026年5月28日にReutersは、ByteDanceが自社の中央プロセッサを2つのルートで開発していることを発表しました：SoftBankが所有するArmアーキテクチャと、オープンな命令セットであるRISC-Vアーキテクチャです。

このプログラムは、グループのエージェントプラットフォームであるCozeを通じたAIエージェントの拡大展開に関連しています。その即時の動機は経済的であると同時に戦略的です。Intelは中国の顧客に対して、一部のサーバーCPUの納期が最大6か月になると通知し、四半期ごとに10%から35%の価格上昇をしているとReutersは報じています。したがって、ByteDanceにとっての課題は、単に「アメリカのハイパースケーラーと同じことをする」ことではなく、AIが大規模に使用されるためのハードウェア基盤を確保することです。

AIの戦いはGPUだけではない

過去2年間、AIに関するハードウェアの議論はNvidia、アメリカの輸出制限、GPU H100/H200/B200、およびHuawei Ascendのような中国の代替品に焦点を当ててきました。この枠組みは必要ですが、不完全です。

GPUとIAアクセラレーターは、大規模モデルのトレーニングと最も集中的な推論負荷のために中心的な役割を果たし続けます。しかし、AIエージェントは別の制約を導入します。エージェントは単一のパスで長い応答を生成するだけではありません。計画を立て、ツールを呼び出し、結果を確認し、サブタスクを再開し、ドキュメントベースを参照し、コードを実行し、APIとインタラクトし、推論ループを増やします。

このような負荷では、サーバーCPUが再び重要になります。IAアクセラレーターを置き換えるわけではありませんが、推論の完全なコストを条件付けます：呼び出しのオーケストレーション、コンポーネント間のレイテンシー、セッション管理、セキュリティ、スケジューリング、前処理、後処理、エージェントが呼び出す関数の実行。

ByteDanceがこのレイヤーを制御しようとしているようです。Reutersによって明らかにされたプロジェクトは、Nvidiaを自社CPUで直接置き換える試みとして読まれるべきではありません。むしろ、特にエージェント推論負荷の周りのサーバーベースを垂直統合する動きです。

中国のサーバーマーケットはIntelから外れつつある

この変化はByteDanceだけに関するものではありません。Business Timesが引用した2026年1月のUBSの研究によると、中国のサーバープロセッサ市場でのIntelのシェアは、2019年の90%以上から2025年には約60%に低下したとされています。AMDは、同じ期間で約5%から20%以上に増加しました。

この変化には2つの結果があります。まず、Intelはもはや中国のサーバー市場でのほぼ独占的な地位にありません。次に、大規模な中国の顧客は、特に納期、価格、地政学的制約が同時に増加する場合、ハードウェアスタックを多様化する強い動機を持つようになりました。

中国はIntelの総売上高の20%以上を占めています。しかし、第四世代および第五世代のXeonの不足は、地元の顧客にとってこの依存をより費用のかかるものにしています。この文脈で、ByteDanceによる自社CPUの開発は、より大きな動きの一部です：大手中国の出版社がArm、RISC-V、または国内供給元に由来するよりよく制御されたアーキテクチャへの段階的な移行。

しかし、プログラムはまだ初期段階です。ByteDanceは2022年になって初めてハードウェア設計チームを結成しました。グループは、Apple、Google、Amazon、Microsoftのように、自社のチップを開発するために必要なスキルを15〜20年にわたって蓄積してきた企業に比べて、限られた経験しか持っていません。

ハイパースケーラーの前例：交通のしきい値、制裁への単なる反応ではない

ByteDanceの動きは、アメリカの大手ハイパースケーラーの動きを思い起こさせます。Google、AWS、Microsoftは、自国のチップを開発することを主に主権や戦略的コミュニケーションの理由で行ったわけではありません。交通、コスト、またはパフォーマンスのしきい値が、標準的な購入モデルが不十分であることを示したときに行ったのです。

Googleでは、音声検索がデータセンターの計算ニーズを倍増させる可能性があるとする内部プロジェクションが示された2013年に、IA専用アクセラレーターを開発する決定が下されました。TPUは、エンジンの内部負荷に対して設計され、その後大規模に開発され、特定のワークロードに対してCPUおよびGPUの同時代品に対して大規模な利得をもたらしました。

AWSは、GPUインスタンスに対してトレーニングコストを削減するために設計されたTrainiumを続けました。Microsoftは、クラウド全般の負荷を最適化するために設計された独自のArm CPUであるAzure Cobalt 100を一般化し、以前のArm世代よりも優れた価格/パフォーマンス比を提供しました。

共通点は、チップの正確な性質ではありません。TPUとTrainiumはIAアクセラレーターです。Cobalt 100はArm CPUです。ByteDanceのプロジェクトはArmとRISC-VのCPUに関するものです。共通点はもっと深いところにあります：あるプレイヤーが十分な規模に達すると、自社のシリコンの一部を内部化して、自社の負荷を最適化し、市場の標準に完全に依存しないようにすることを求めます。

ByteDanceはこの論理に入っています。しかし、そのケースは重要な点で異なります：アメリカのハイパースケーラーはTSMCと高度なサプライチェーンに頼ることができました。ByteDanceの将来のCPUのファウンダリーは発表されていません。

SMICはTSMCではない：構造的仮説、単なる詳細ではない

ファウンダリーはこの案件の大きな盲点です。ReutersはByteDanceの将来のCPUを誰が製造するのかを明示していません。一部のアナリストは、輸出制限と地政学的文脈を考慮して、SMICが最も可能性が高いオプションとして言及していますが、この仮説は確認されていません。

しかし、それは経済的計算を根本的に変えます。Google、AWS、Microsoftの前例は、TSMCの最高の製造ノードへのアクセス能力に基づいています。もしByteDanceがSMICに依存することになると、収率、エネルギー密度、ウェーハあたりのコストの差が重要になります。

言い換えれば、垂直統合は自動的に利益を保証するわけではありません。全体のコスト（設計、製造、収率、消費、ソフトウェアメンテナンス、生産量、データセンター統合）がIntelまたはAMDのCPUの購入よりも低くなるか、戦略的に好ましい場合にのみ意味があります。

ByteDanceの場合、動機は攻撃的であると同時に防御的でもあります：供給のセキュリティを確保し、IntelとAMDへの依存を減らし、内部負荷にCPUを適応させ、長期間にわたって制御を得るために初期の追加コストを受け入れること。

注：SMICは仮説であり、確立された事実ではありません。しかし、この仮説が確認されれば、アメリカのハイパースケーラーとの比較は大いに修正されるべきです：自社のチップを開発しても、世界最高の製造ノードにアクセスできるかどうかによって得られる利益は同じではありません。

ハイブリッドなハードウェア戦略、西洋のロックインからの脱却ではない

自社のCPUを開発することは、ByteDanceが西洋のハードウェアロックインから脱却することを意味しません。むしろ、利用可能な情報はずっとハイブリッドな戦略を描いています。

ByteDanceは、2026年の投資計画を2,000億元（約294億ドル）に引き上げたと報じられています。これは、当初の1,600億元から25%の増加です。当初の計画では、850億元がIAチップに向けられる予定でした。しかし、改訂された計画の詳細な内訳は公表されていません。

並行して、BloombergはQualcommがカスタマイズされたIA ASICをByteDanceのデータセンターに供給する契約を獲得したと報じています。同グループはまた、Huawei Ascendチップに数十億ドルを費やすとされています。Nvidiaは、輸出制限にもかかわらず、大規模な事前トレーニング負荷に対して依然として置き換えが難しいとされています。

この組み合わせは、明確な断絶の考え方に反しています。ByteDanceは、Nvidia、Huawei、Qualcomm、Arm、RISC-V、および自社の開発の間で選択しているようには見えません。使用法に応じて複数のハードウェア層の間で調整を行っています：トレーニング、推論、エージェント、内部クラウド、可用性、コスト、準拠性、地政学的制約。

この戦略は、自己完結型の追求というよりも産業的保証に似ています：単一のサプライヤー、単一のアーキテクチャ、単一の輸出制度に依存しないようにすること。

なぜエージェント推論が計算を変えるのか

この案件で最も重要な要素は、最も劇的でないかもしれません：エージェント型AIはコストの重心を移動させます。

従来のチャットボットでは、見えるコストの大部分はモデルと推論を実行するアクセラレーターに関連しています。エージェントシステムでは、各応答が一連のアクションを引き起こす可能性があります：計画、検索、ツール呼び出し、検証、中間生成、実行、修正、新しいリクエスト、最終的な返答。

大規模では、これらのループはGPUだけでなく、インフラ全体を動員します。CPUは、タスクごとのコストの中心的な部分となり、サーバーのコモディティではなくなります。

これがByteDanceのケースを面白くしています。DoubaoとCozeで、グループは単に会話を提供しようとしているのではありません。行動できるエージェントを構築し、サービスをオーケストレーションし、機械対機械のインタラクションを増やすインフラを構築しています。この規模で、ハードウェアの最適化はもはや単なる性能を目指すものではなく、各エージェントアクションの限界コストを目指すものです。

まだ勝利から遠い賭け

しかし、プロジェクトはまだ成熟からは程遠いです。競争力のあるサーバーCPUを設計するには、莫大なハードウェア、ソフトウェア、産業の専門知識が必要です。コアを開発または適応させ、消費を最適化し、ソフトウェアの互換性を確保し、コンパイラを維持し、製造チェーンを安全にし、ボリュームを保証し、内部チームを説得して負荷を移行させる必要があります。

自社シリコンの大成功は、単なるチップに依存することはめったにありません。それは完全なスタックに依存しています：ハードウェア、低レベルソフトウェア、内部フレームワーク、安定したワークロード、大量のボリューム、複数年にわたるコストの償却能力。

ByteDanceにはボリュームがあります。また、明らかな経済的圧力もあります。しかし、Google、Amazon、Microsoftのように、これらの制約を物質的な利点に変えることができるかどうかはまだ証明されていません。

したがって、このプロジェクトはそのまま読み取るべきです：サーバーCPU市場の即時の革命ではなく、戦略的な信号です。エージェント型AIが負荷のプロファイルを変えるにつれて、大手企業はもはや標準的なコンポーネントの購入に満足することはできません。トークンごとのコスト、可用性、運用上の独立性を決定するハードウェアレイヤーを制御しようとしています。

完全なコストの戦い

ByteDanceによるArmおよびRISC-V CPUの開発は、大規模なAIの産業化における段階を示しています。モデルの戦い、次にGPUの戦いの後、次の戦いは実行の完全なコストです。

この戦いで勝者は、最良のモデルまたは最良のアクセラレーターを持つ者ではなく、自社の使用に合わせてハードウェアアーキテクチャ、ソフトウェア、オーケストレーション、調達、単位コストを調整できる者です。

ByteDanceはまだこの賭けに勝利していません。しかし、Doubao、Coze、および推論のボリュームを持つことで、グループにはそれを試す経済的理由があります。