مع Doubao، تقول ByteDance إنها تعالج 120,000 تريليون رمز يوميًا. على هذا النطاق، لا يقتصر التحدي المادي على Nvidia GPU: بل تصبح CPU الخوادم، التي طالما كانت محط اهتمام ثانوي في نقاشات الذكاء الاصطناعي، مرة أخرى متغيرًا استراتيجيًا. وفقًا لـReuters، فإن المجموعة الصينية تطور عائلتين من المعالجات الخاصة بها، إحداهما تعتمد على Arm والأخرى على RISC-V، لدعم نشر وكلاء الذكاء الاصطناعي عبر Coze وتقليل اعتمادها على Intel وAMD.

يبدو أن ByteDance قد بلغت مرحلة صناعية جديدة. في مارس 2026، كانت Doubao تعالج 120,000 تريليون رمز يوميًا - 120 تريليون وفقًا للمعايير الأنجلو-أمريكية - وفقًا للأرقام التي نشرتها Volcano Engine والتي نقلها TechNode. كان الاستخدام قد تضاعف في ثلاثة أشهر وتزايد ألف مرة منذ الإطلاق العام للنموذج في مايو 2024.

على هذا المستوى من الحركة، لم تعد تكلفة الاستدلال تعتمد فقط على سعر مسرعات الذكاء الاصطناعي. بل تعتمد أيضًا على كامل البنية التحتية للخادم: CPU، الذاكرة، التنسيق، استدعاءات الأدوات، الوصول إلى قواعد البيانات، الشبكة، الطوابير، الكمون والتوافر. في هذا السياق، كشفت Reuters في 28 مايو 2026، أن ByteDance تطور معالجاتها المركزية الخاصة وفقًا لنهجين: بنية Arm، المملوكة لـSoftBank، وبنية RISC-V، وهي مجموعة تعليمات مفتوحة.

يرتبط البرنامج بنشر واسع النطاق لوكلاء الذكاء الاصطناعي عبر Coze، منصة الوكلاء التابعة للمجموعة. ودافعها الفوري هو اقتصادي بقدر ما هو استراتيجي: يُقال إن Intel قد أبلغت عملائها في الصين عن تأخيرات في تسليم بعض CPU الخوادم تصل إلى ستة أشهر، مع زيادات في الأسعار تتراوح بين 10 إلى 35٪ لكل ربع سنة وفقًا لـReuters. بالنسبة لـByteDance، فإن التحدي ليس فقط "القيام كما يفعل عمالقة السحابة الأمريكيون"، ولكن تأمين الأساس المادي للذكاء الاصطناعي المستخدم على نطاق واسع.

المعركة في مجال الذكاء الاصطناعي لا تقتصر فقط على GPU

خلال العامين الماضيين، تركز النقاش المادي حول الذكاء الاصطناعي على Nvidia، والقيود الأمريكية على التصدير، وGPU H100/H200/B200 والبدائل الصينية مثل Huawei Ascend. هذا التوجيه ضروري ولكنه غير مكتمل.

تظل GPU ومسرعات الذكاء الاصطناعي مركزية لتدريب النماذج الكبيرة ولأعباء الاستدلال الأكثر كثافة. لكن وكلاء الذكاء الاصطناعي يقدمون قيدًا آخر. الوكيل لا يكتفي بإنتاج استجابة طويلة في عملية واحدة. بل يخطط، يستدعي أدوات، يتحقق من النتائج، يعيد تشغيل المهام الفرعية، يستشير قواعد بيانات، ينفذ الشيفرات، يتفاعل مع API ويضاعف حلقات التفكير.

في هذا النوع من الأعباء، يصبح CPU الخادم حاسمًا مرة أخرى. لا يستبدل مسرع الذكاء الاصطناعي، ولكنه يحدد التكلفة الكاملة للاستدلال: تنسيق الاستدعاءات، الكمون بين المكونات، إدارة الجلسات، الأمان، الجدولة، المعالجة المسبقة، المعالجة اللاحقة وتنفيذ الوظائف المستدعاة من قبل الوكلاء.

هذا هو الطبقة التي يبدو أن ByteDance تسعى لاستعادتها. لا ينبغي قراءة المشروع الذي كشفت عنه Reuters كمحاولة لاستبدال Nvidia مباشرة بمعالجات CPU منزلية. بل هو حركة للتكامل الرأسي على أساس الخادم الذي يحيط بأعباء الذكاء الاصطناعي، وخاصة أعباء الاستدلال الوكيلة.

سوق الخوادم الصينية الذي ينزلق بعيدًا عن Intel

التغير لا يقتصر فقط على ByteDance. وفقًا لدراسة UBS في يناير 2026 التي نقلتها Business Times، فإن حصة Intel في سوق معالجات الخوادم في الصين قد انخفضت من أكثر من 90٪ في 2019 إلى حوالي 60٪ في 2025. خلال نفس الفترة، ارتفعت حصة AMD من حوالي 5٪ إلى أكثر من 20٪.

هذا التطور له نتيجتان. أولاً، لم تعد Intel في وضع احتكار شبه كامل في سوق الخوادم الصينية. ثانيًا، بات لدى العملاء الصينيين الكبار الآن حافز أقوى لتنويع بنيتهم التحتية المادية، خاصة عندما تزداد التأخيرات، الأسعار والقيود الجيوسياسية في آن واحد.

تمثل الصين أكثر من 20٪ من إجمالي إيرادات Intel. لكن النقص في Xeon من الجيل الرابع والخامس جعل هذا الاعتماد أكثر تكلفة للعملاء المحليين. في هذا السياق، يعتبر تطوير CPU منزلية بواسطة ByteDance جزءًا من حركة أوسع: تلك المتمثلة في انتقال تدريجي للناشرين الصينيين الكبار نحو بنى معمارية أكثر تحكمًا، سواء كانت Arm، RISC-V أو من مزودين محليين.

لا يزال البرنامج في مراحله الأولى. لم تقم ByteDance بتشكيل فريق التصميم المادي الخاص بها إلا في عام 2022. وبالتالي، فإن المجموعة لديها خبرة محدودة مقارنة بشركات مثل Apple، Google، Amazon أو Microsoft، التي تراكمت لديها الخبرات اللازمة لتطوير رقائقهم الخاصة لمدة تتراوح بين خمسة عشر وعشرين عامًا.

سابقة عمالقة السحابة: عتبة حركة مرور، وليس مجرد رد فعل على العقوبات

تذكرنا حركة ByteDance بتحركات عمالقة السحابة الأمريكيين. لم تطور Google، AWS وMicrosoft رقائقهم المنزلية لأسباب تتعلق بالسيادة أو التواصل الاستراتيجي فقط. بل فعلوا ذلك عندما أصبح حجم الحركة، التكلفة أو الأداء يجعل نموذج الشراء القياسي غير كافٍ.

في حالة Google، تم اتخاذ قرار تطوير مسرع مخصص للذكاء الاصطناعي في عام 2013 عندما أظهرت توقعات داخلية أن البحث الصوتي يمكن أن يضاعف احتياجات حساب مراكز البيانات. تم تطوير TPU، المصمم للأعباء الداخلية للمحرك، ونشره بسرعة كبيرة، مع تحقيق مكاسب ضخمة مقارنة بـCPU وGPU الموجودة في ذلك الوقت على بعض أعباء العمل.

تبعت AWS مع Trainium، الذي صمم لتقليل تكلفة التدريب مقارنة بحالات GPU. عممت Microsoft Azure Cobalt 100، وهو CPU Arm منزلي مصمم لتحسين الأعباء السحابية العامة، مع نسبة سعر/أداء أفضل من الجيل السابق من Arm.

النقطة المشتركة ليست في طبيعة الرقاقة بالضبط. TPU وTrainium هما مسرعان للذكاء الاصطناعي؛ Cobalt 100 هو CPU Arm; مشاريع ByteDance تدور حول CPU Arm وRISC-V. النقطة المشتركة أعمق: عندما يصل أحد اللاعبين إلى حجم كافٍ، يسعى إلى استيعاب جزء من السليكون الخاص به لتحسين أعبائه الخاصة بدلاً من الاعتماد بالكامل على السوق القياسي.

تدخل ByteDance في هذا المنطق. لكن حالتها تختلف في نقطة أساسية: عمالقة السحابة الأمريكيون تمكنوا من الاعتماد على TSMC وسلسلة توريد متقدمة. لم يتم الإعلان عن الشركة المصنعة للCPU المستقبلية لـByteDance.

SMIC ليست TSMC: فرضية بنيوية، وليس مجرد تفصيل

الشركة المصنعة هي الزاوية العمياء الكبرى في الملف. لم تحدد Reuters من سيقوم بتصنيع وحدات المعالجة المركزية المستقبلية لـByteDance. يشير بعض المحللين إلى SMIC كخيار محتمل، نظرًا للقيود على التصدير والسياق الجيوسياسي، لكن هذه الفرضية لم تؤكد.

مع ذلك، فهي تغير الحساب الاقتصادي جذريًا. تعتمد السوابق السابقة لـGoogle، AWS أو Microsoft على القدرة على الوصول إلى أفضل عقد تصنيع من TSMC. إذا كان على ByteDance الاعتماد على SMIC، فسيصبح الاختلاف في الكفاءة، كثافة الطاقة والتكلفة لكل ويفر مركزيًا.

بعبارة أخرى، التكامل الرأسي لا يضمن تلقائيًا مكسبًا. له معنى فقط إذا أصبحت التكلفة الإجمالية - التصميم، التصنيع، الكفاءة، الاستهلاك، الصيانة البرمجية، حجم الإنتاج وتكامل مركز البيانات - أقل أو مفضلة استراتيجيًا على شراء CPU من Intel أو AMD.

في حالة ByteDance، يمكن أن تكون الدافع دفاعيًا بقدر ما هو هجومي: تأمين التوريد، تقليل الاعتماد على Intel وAMD، تكييف CPU مع الأعباء الداخلية، ولكن أيضًا قبول تكلفة زائدة ابتدائية لاكتساب السيطرة على المدى الطويل.

النقطة الأساسية: تظل SMIC فرضية، وليست حقيقة مثبتة. لكن إذا تأكدت هذه الفرضية، ينبغي تعديل المقارنة مع عمالقة السحابة الأمريكيين بشكل كبير: تطوير رقاقة خاصة لا يحقق نفس المكاسب اعتمادًا على ما إذا كان يمكن الوصول إلى أفضل عقد التصنيع العالمية أم لا.

استراتيجية مادية هجينة، وليس خروجًا من الحصار الغربي

لا يعني تطوير CPU منزلية أن ByteDance تخرج من الحصار المادي الغربي. على العكس، تشير المعلومات المتاحة إلى استراتيجية أكثر هجينة بكثير.

يُقال إن ByteDance قد زادت خطتها الاستثمارية لعام 2026 إلى 200 مليار يوان، أي حوالي 29.4 مليار دولار، بزيادة 25٪ عن حزمة أولية بلغت 160 مليار. في الخطة الأولية، تم تخصيص 85 مليار يوان للرقائق الذكاء الاصطناعي. لكن التوزيع التفصيلي للحزمة المنقحة لم يتم الإعلان عنه.

بالتوازي، أبلغت Bloomberg أن Qualcomm قد فازت بعقد لتزويد مراكز بيانات ByteDance بملايين من ASIC الذكاء الاصطناعي المخصصة. المجموعة تخصص أيضًا مليارات الدولارات لرقائق Huawei Ascend. يظل Nvidia مع ذلك صعبًا استبداله في أعباء التدريب المسبق على نطاق واسع، رغم القيود على التصدير.

تتناقض هذه التوليفة مع فكرة حدوث قطيعة واضحة. لا يبدو أن ByteDance تختار بين Nvidia، Huawei، Qualcomm، Arm، RISC-V وتطويراتها الخاصة. بل تتحكم بين عدة طبقات مادية حسب الاستخدامات: التدريب، الاستدلال، الوكلاء، السحابة الداخلية، التوافر، التكلفة، الامتثال والقيود الجيوسياسية.

تشبه الاستراتيجية أقل إلى البحث عن الاكتفاء الذاتي من كونها تأمين صناعي: عدم الاعتماد على مورد واحد، أو بنية واحدة، أو نظام تصدير واحد.

لماذا يغير الاستدلال الوكيلة الحساب

العنصر الأكثر أهمية في الملف ربما يكون الأقل إثارة: الذكاء الاصطناعي الوكيلة ينقل مركز الثقل من التكلفة.

في روبوت دردشة تقليدي، يرتبط الجزء الأكبر من التكلفة المرئية بالنموذج والمسرع الذي ينفذ الاستدلال. في نظام وكيل، يمكن لكل استجابة أن تطلق سلسلة من الإجراءات: التخطيط، البحث، استدعاء أداة، التحقق، التوليد الوسيط، التنفيذ، التصحيح، طلب جديد والاسترجاع النهائي.

على نطاق واسع، لا تستهلك هذه الحلقات فقط GPU. بل تعبئ البنية التحتية بأكملها. يصبح CPU حينها جزءًا مركزيًا من التكلفة لكل مهمة، وليس مجرد سلعة خادم.

هذا ما يجعل حالة ByteDance مثيرة للاهتمام. مع Doubao وCoze، لا تسعى المجموعة فقط لخدمة المحادثات. بل تبني بنية تحتية لوكلاء قادرين على العمل، تنظيم الخدمات وتعدد التفاعلات بين الآلات. على هذا المستوى، لا تستهدف التحسين المادي الأداء الخام فقط. بل تستهدف تكلفة العمل الهامشية لكل إجراء وكيل.

رهان بعيد عن أن يُربح

مع ذلك، لا يزال المشروع بعيدًا عن النضج. يتطلب تصميم CPU خادم تنافسي خبرة مادية، برمجية وصناعية هائلة. يجب تطوير أو تكييف النوى، تحسين الاستهلاك، ضمان التوافق البرمجي، الحفاظ على المترجمين، تأمين سلسلة الإنتاج، ضمان الأحجام وإقناع الفرق الداخلية بالتحول لأعباء العمل الخاصة بها.

نادراً ما تعتمد النجاحات الكبيرة للسليكون المنزلي على الرقاقة وحدها. بل تعتمد على حزمة كاملة: مادية، برامج منخفضة المستوى، أطر عمل داخلية، أعباء عمل مستقرة، أحجام ضخمة وقدرة على امتصاص التكاليف على مدار سنوات عديدة.

تمتلك ByteDance الحجم. كما أن لديها ضغط اقتصادي واضح. لكنها لم تظهر بعد أنها قادرة على تحويل هذه القيود إلى ميزة مادية قابلة للمقارنة مع تلك الخاصة بـGoogle، Amazon أو Microsoft.

لذا يجب قراءة المشروع لما هو عليه: ليس ثورة فورية في سوق CPU الخادم، بل إشارة استراتيجية. مع تغير الذكاء الاصطناعي الوكيلة لمحات الأعباء، لم يعد بإمكان اللاعبين الكبار الاكتفاء بشراء المكونات القياسية. يسعون للسيطرة على الطبقات المادية التي تحدد تكلفتهم لكل رمز، توفرهم واستقلالهم التشغيلي.

معركة التكلفة الكاملة

يمثل تطوير CPU Arm وRISC-V من قبل ByteDance خطوة في التصنيع الشامل للذكاء الاصطناعي. بعد معركة النماذج، ثم معركة GPU، تفتح معركة أخرى: معركة التكلفة الكاملة للتنفيذ.

في هذه المعركة، لن يكون الفائز فقط من يملك أفضل نموذج أو أفضل مسرع. بل سيكون من يعرف كيفية مواءمة البنية المادية، البرمجيات، التنسيق، التوريد والتكاليف الفردية مع استخداماته الخاصة.

لم تربح ByteDance بعد هذا الرهان. لكن مع Doubao وCoze وأحجام الاستدلال الخاصة بها، أصبح لدى المجموعة الآن سبب اقتصادي لمحاولته.