ByteDance, 자체 Arm 및 RISC-V CPU 준비 중

ByteDance, 자체 Arm 및 RISC-V CPU 준비 중

TLDR : ByteDance는 AI 에이전트의 대규모 배포를 지원하기 위해 자체 Arm 및 RISC-V CPU를 개발 중이며, 이는 실행의 총 비용을 줄이고 Intel 및 AMD에 대한 의존도를 줄이려는 전략의 일환입니다.

Doubao를 통해 ByteDance는 하루에 120,000조 개의 토큰을 처리한다고 주장합니다. 이 규모에서는 GPU Nvidia뿐만 아니라 서버 CPU도 중요한 전략적 변수가 됩니다. Reuters에 따르면, 중국 기업 ByteDance는 Coze를 통해 AI 에이전트의 배포를 지원하고 Intel 및 AMD에 대한 의존도를 줄이기 위해 Arm 및 RISC-V 기반의 두 가지 자체 프로세서 제품군을 개발 중이라고 합니다.

ByteDance는 산업적 문턱을 넘었습니다. 2026년 3월, Doubao는 하루에 120,000조 개의 토큰을 처리했습니다 - 영미권 천조 - Volcano Engine이 발표하고 TechNode가 전달한 수치에 따르면, 사용량은 세 달 만에 두 배로 증가했으며 2024년 5월 모델의 공개 출시 이후 천 배 증가했습니다.

이 수준의 트래픽에서는 추론 비용이 AI 가속기의 가격뿐만 아니라 전체 서버 스택에 의존하게 됩니다: CPU, 메모리, 오케스트레이션, 도구 호출, 데이터베이스 접근, 네트워크, 대기열, 지연 시간 및 가용성까지. 이런 맥락에서 2026년 5월 28일 Reuters는 ByteDance가 두 가지 경로로 자체 중앙 프로세서를 개발 중이라고 밝혔습니다: SoftBank 소유의 Arm 아키텍처와 오픈 소스 명령어 세트인 RISC-V 아키텍처.

이 프로그램은 그룹의 에이전트 플랫폼인 Coze를 통해 AI 에이전트의 확장된 배포와 연결되어 있습니다. 즉각적인 동기는 경제적이며 전략적입니다: Intel은 중국 고객에게 특정 서버 CPU의 배송 지연을 최대 6개월까지 통보했으며, Reuters에 따르면 분기별로 10%에서 35%까지 가격 인상을 경험하고 있다고 합니다. 따라서 ByteDance에게는 "미국의 하이퍼스케일러처럼" 하는 것뿐만 아니라 대규모로 사용되는 AI의 하드웨어 기반을 확보하는 것이 중요합니다.

IA 전투는 단지 GPU에서만 벌어지지 않는다

지난 2년 동안, AI에 대한 하드웨어 논쟁은 Nvidia, 미국의 수출 제한, GPU H100/H200/B200 및 Huawei Ascend와 같은 중국 대안에 집중되었습니다. 이 프레이밍은 필수적이지만 불완전합니다.

GPU와 AI 가속기는 여전히 대규모 모델의 훈련과 가장 집약적인 추론 작업에 필수적입니다. 그러나 AI 에이전트는 또 다른 제약을 도입합니다. 에이전트는 단일 패스로 긴 응답을 생성하는 것만으로는 충분하지 않습니다. 도구를 호출하고, 결과를 확인하고, 하위 작업을 재개하고, 문서 기반을 참조하고, 코드를 실행하며, API와 상호 작용하고, 추론 루프를 반복합니다.

이러한 유형의 작업에서 서버 CPU는 다시 중요해집니다. AI 가속기를 대체하는 것은 아니지만 추론의 전체 비용을 결정합니다: 호출 오케스트레이션, 구성 요소 간 지연, 세션 관리, 보안, 스케줄링, 전처리, 후처리 및 에이전트가 호출하는 기능의 실행.

ByteDance는 이 레이어를 직접 관리하려는 것 같습니다. Reuters가 공개한 프로젝트는 Nvidia를 자체 CPU로 직접 대체하려는 시도로 읽혀서는 안 됩니다. 이는 특히 에이전트 추론 작업을 둘러싼 서버 기반을 수직적으로 통합하려는 움직임입니다.

Intel에서 벗어나는 중국 서버 시장

이 변화는 ByteDance에만 국한되지 않습니다. Business Times가 인용한 2026년 1월의 UBS 연구에 따르면, 중국에서 서버 프로세서의 Intel 시장 점유율은 2019년 90% 이상에서 2025년 약 60%로 감소했습니다. 같은 기간 동안, AMD는 약 5%에서 20% 이상으로 증가했습니다.

이러한 변화는 두 가지 결과를 초래합니다. 첫째, Intel은 더 이상 중국 서버에서 독점적인 위치에 있지 않습니다. 둘째, 대규모 중국 고객들은 지연, 가격 및 지리적 제한이 동시에 증가함에 따라 하드웨어 스택을 더욱 다양화할 유인이 있습니다.

중국은 Intel의 전체 매출의 20% 이상을 차지합니다. 그러나 4세대와 5세대 Xeon의 부족은 현지 고객에게 더 큰 비용을 초래했습니다. 이 상황에서 ByteDance의 자체 CPU 개발은 더 큰 움직임의 일환으로, 주요 중국 소프트웨어 개발자들이 Arm, RISC-V 또는 국내 공급업체의 아키텍처로 점진적으로 이동하고 있습니다.

그러나 프로그램은 아직 초기 단계입니다. ByteDance는 2022년에만 하드웨어 설계 팀을 구성했습니다. 따라서 Apple, Google, Amazon 또는 Microsoft와 같은 기업들이 15~20년 동안 축적한 경험에 비해 제한된 경험을 가지고 있습니다.

하이퍼스케일러의 전례: 트래픽 한계, 단순한 제재에 대한 반응이 아닌

ByteDance의 움직임은 대규모 미국 하이퍼스케일러의 움직임을 상기시킵니다. Google, AWS 및 Microsoft는 주권이나 전략적 커뮤니케이션만을 위해 자체 칩을 개발하지 않았습니다. 그들은 트래픽, 비용 또는 성능의 한계가 표준 구매 모델을 충분하지 않게 만들었을 때 그렇게 했습니다.

Google은 2013년에 내부 투영이 음성 검색이 데이터센터의 계산 요구를 두 배로 늘릴 수 있다는 것을 보여줬을 때 AI 전용 가속기 개발 결정을 내렸습니다. TPU는 검색 엔진의 내부 작업을 위해 설계되어 빠르게 개발 및 배포되었으며, 특정 작업 부하에서 동시대의 CPU 및 GPU에 비해 대규모 이익을 얻었습니다.

AWS는 GPU 인스턴스에 대한 훈련 비용을 줄이기 위해 Trainium을 도입했습니다. Microsoft는 이전 세대 Arm보다 가격/성능 비율이 개선된 클라우드 일반 부하를 최적화하기 위해 자체 Arm CPU인 Azure Cobalt 100을 일반화했습니다.

공통점은 칩의 정확한 성격이 아닙니다. TPU와 Trainium은 AI 가속기입니다; Cobalt 100은 Arm CPU입니다; ByteDance의 프로젝트는 Arm 및 RISC-V CPU에 관한 것입니다. 공통점은 더 깊습니다: 플레이어가 충분한 규모에 도달하면, 표준 시장에 전적으로 의존하기보다는 자체 부하를 최적화하기 위해 일부 실리콘을 내부화하려고 합니다.

ByteDance는 이 논리에 들어갑니다. 그러나 그들의 경우 중요한 점에서 다릅니다: 미국 하이퍼스케일러들은 TSMC와 고급 공급망에 의존할 수 있었습니다. ByteDance의 미래 CPU의 파운드리가 발표되지 않았습니다.

SMIC는 TSMC가 아니다: 구조적 가설, 단순한 세부 사항이 아니다

파운드리는 이 사례의 큰 사각 지대입니다. Reuters는 ByteDance의 향후 CPU를 누가 제조할지 명시하지 않았습니다. 일부 분석가들은 수출 제한과 지리적 정치적 상황을 감안할 때 SMIC를 가능성 있는 옵션으로 언급하지만 이 가설은 확인되지 않았습니다.

그러나 그것은 경제적 계산을 근본적으로 변화시킵니다. Google, AWS 또는 Microsoft의 전례는 TSMC의 최고의 제조 노드에 대한 접근 용량에 의존합니다. ByteDance가 SMIC에 의존해야 한다면, 수율, 에너지 밀도 및 웨이퍼당 비용의 격차가 중심이 됩니다.

다시 말해, 수직적 통합이 자동으로 이익을 보장하지 않습니다. 그것은 총 비용 - 설계, 제조, 수율, 소비, 소프트웨어 유지보수, 생산량 및 데이터센터 통합 - 이 Intel 또는 AMD의 CPU 구매보다 낮거나 전략적으로 선호될 때만 의미가 있습니다.

ByteDance의 경우 동기는 방어적일 수도 있고 공격적일 수도 있습니다: 공급 보안, Intel 및 AMD 의존도 감소, 내부 부하에 대한 CPU 조정, 그러나 또한 초기 비용을 수용하고 장기간에 걸친 통제를 얻는 것입니다.

주목할 점: SMIC는 가설일 뿐이며, 확고한 사실이 아닙니다. 그러나 이 가설이 확인된다면, 미국 하이퍼스케일러와의 비교는 크게 조정되어야 합니다: 자체 칩을 개발한다고 해서 세계 최고의 제조 노드에 접근할 수 있는지 여부에 따라 동일한 이익을 얻을 수는 없습니다.

하이브리드 하드웨어 전략, 서구 잠금에서 벗어나지 않음

자체 CPU 개발은 ByteDance가 서구의 하드웨어 잠금에서 벗어남을 의미하지 않습니다. 오히려, 사용 가능한 정보는 훨씬 더 하이브리드한 전략을 그립니다.

ByteDance는 2026년 투자 계획을 2천억 위안, 즉 약 294억 달러로, 초기 1천6백억 위안에서 25% 증가시켰습니다. 초기 계획에서는 850억 위안이 AI 칩에 할당되었습니다. 그러나 개정된 계획의 상세한 분배는 공개되지 않았습니다.

동시에, Bloomberg에 따르면 Qualcomm은 ByteDance 데이터센터에 수백만 개의 맞춤형 AI ASIC을 공급하기 위한 계약을 따낸 것으로 보도되었습니다. 그룹은 또한 Huawei Ascend 칩에 수십억 달러를 할애할 예정입니다. Nvidia는 대규모 사전 훈련 작업에서 여전히 대체하기 어려운 상황입니다.

이 조합은 명확한 단절의 아이디어를 반박합니다. ByteDance는 Nvidia, Huawei, Qualcomm, Arm, RISC-V 및 자체 개발 사이에서 선택하는 것 같지 않습니다. 그들은 사용에 따라 여러 하드웨어 계층을 중재하고 있습니다: 훈련, 추론, 에이전트, 내부 클라우드, 가용성, 비용, 규정 준수 및 지리적 제약.

이 전략은 자급자족의 탐구보다는 산업적 보증에 더 가깝습니다: 하나의 공급업체, 하나의 아키텍처, 하나의 수출 체제에 의존하지 않음.

에이전트 추론이 계산을 바꾸는 이유

이 사례에서 가장 중요한 요소는 아마도 가장 덜 극적일 것입니다: 에이전트 AI는 비용의 중심을 이동시킵니다.

전통적인 챗봇에서는 보이는 주요 비용이 모델과 추론을 실행하는 가속기에 연결됩니다. 에이전트 시스템에서는 각 응답이 작업 체인을 트리거할 수 있습니다: 계획, 검색, 도구 호출, 확인, 중간 생성, 실행, 수정, 새로운 요청 및 최종 반환.

대규모로, 이러한 루프는 단지 GPU만 소비하지 않습니다. 그들은 전체 인프라를 동원합니다. CPU는 이제 작업당 비용의 중심 요소가 되며, 더 이상 단순 서버 상품이 아닙니다.

ByteDance의 경우가 흥미로운 이유는 바로 이 때문입니다. Doubao와 Coze를 통해 그룹은 단순히 대화를 제공하는 것이 아닙니다. 그들은 서비스를 조정하고 기계 간 상호 작용을 증대할 수 있는 에이전트를 위한 인프라를 구축하고 있습니다. 이 수준에서, 하드웨어 최적화는 더 이상 단순한 성능을 목표로 하지 않습니다. 그것은 각 에이전트 작업의 한계 비용을 목표로 합니다.

아직 성공하지 않은 도박

그러나 프로젝트는 아직 성숙하지 않았습니다. 경쟁력 있는 서버 CPU를 설계하려면 상당한 하드웨어, 소프트웨어 및 산업적 전문 지식이 필요합니다. 코어를 개발하거나 조정하고, 소비를 최적화하고, 소프트웨어 호환성을 보장하고, 컴파일러를 유지하며, 제조 체인을 보안하고, 볼륨을 보장하며, 내부 팀이 그들의 작업을 이전하도록 설득해야 합니다.

자체 실리콘의 주요 성공 사례는 칩 하나만으로는 드물게 이루어집니다. 그것은 전체 스택에 달려 있습니다: 하드웨어, 저수준 소프트웨어, 내부 프레임워크, 안정화된 작업 부하, 대량 및 여러 해에 걸쳐 비용을 감가상각할 수 있는 능력.

ByteDance는 볼륨을 보유하고 있습니다. 또한 분명한 경제적 압박도 있습니다. 그러나 Google, Amazon 또는 Microsoft와 같은 회사들이 가지고 있는 것과 비교할 수 있는 하드웨어 이점을 만들 수 있다는 것을 아직 입증하지 않았습니다.

따라서 프로젝트는 그 자체로 읽혀야 합니다: 즉, 즉각적인 서버 CPU 시장의 혁명이 아니라 전략적 신호입니다. 에이전트 AI가 작업 프로파일을 변경함에 따라 주요 플레이어는 더 이상 표준 구성 요소 구매에 만족할 수 없습니다. 그들은 토큰 당 비용, 가용성 및 운영 독립성을 결정하는 하드웨어 계층을 통제하려고 합니다.

총 비용의 전투

ByteDance의 Arm 및 RISC-V CPU 개발은 매우 대규모 AI 산업화의 단계입니다. 모델 전투, 그리고 GPU 전투에 이어 또 다른 전투가 열리고 있습니다: 실행의 총 비용 전투입니다.

이 전투에서 승자는 최고의 모델이나 최고의 가속기를 가진 사람만이 아닙니다. 그것은 자신의 사용에 맞춰 하드웨어 아키텍처, 소프트웨어, 오케스트레이션, 조달 및 단위 비용을 정렬할 수 있는 사람입니다.

ByteDance는 아직 이 도박에서 이기지 못했습니다. 그러나 Doubao, Coze 및 그들의 추론 볼륨과 함께, 그룹은 이제 시도할 경제적 이유를 가지고 있습니다.