أعلنت شركة هواوي تكنولوجيز عن تقنية جديدة تُدعى SuperPod تستخدم ربطاً واسعاً لبطاقات رسومية مزودة بشرائح “أسيند” التابعة لها، في خطوة استراتيجية لمنافسة هيمنة شركة إنفيديا في سوق الحوسبة العالية والأجهزة المخصصة للذكاء الاصطناعي.
المزايا الأساسية للتقنية:
-
ربط كبير لشرائح أسيند: تستطيع التقنية الربط بين ما يصل إلى 15,488 بطاقة رسومية مزودة بشرائح أسيند، مما يتيح إنشاء مجموعات ضخمة من شرائح الحوسبة لتوفير قدرة معالجة أعلى.
-
هدف التنافس مع إنفيديا: من خلال هذه التقنية، تحاول هواوي تعويض الفارق في القوة الحوسبية بين شرائحها ونظيراتها من الشركات الأمريكية من خلال جمع مجموعة كبيرة من الرقائق في عنقود واحد لزيادة الأداء الكلي.
-
سياق سياسي وتقني: يأتي ذلك في ظل ضغوط من الحكومة الصينية تشجع الشركات على تجنّب استخدام رقائق أمريكية مثل “آر تي إكس برو 6000 دي” أو رقائق “إتش 20”، وتعزيز البدائل المحلية.
التحديات والفرص:
التحديات تشمل استهلاك الطاقة، إدارة الحرارة والتبريد، وكذلك التحقق من الكفاءة مقارنةً بالتكلفة عند استخدام عدد كبير من البطاقات. أما الفرص فتكمن في تمكين الصين من الاعتماد على نفسها في قطاعات الذكاء الاصطناعي والبُنى التحتية الحاسوبية العالية، وتعزيز الابتكار المحلي، وقد تكون هذه التقنية خطوة مهمة في استدامة هذا التوجه.
المقارنة التقنية: Huawei Ascend vs Nvidia H100
| البند | هواوي Ascend (خصوصًا 910C / 910D) | إنفيديا H100 |
|---|---|---|
| الأداء الخام في التدريب والاستدلال (Inference & Training) | + شرائح 910C تصل إلى حوالي 60-70% من أداء H100 في مهام الاستدلال في بعض التطبيقات. TrendForce+2nexgen-compute.com+2 + الأداء في التدريب (خاصة عند استخدام BF16 أو FP16) لا يزال أقل من H100، ربما بسبب عدد المعالجات المدمجة، أو بنية الذاكرة والتبعية للتصميم الكلي للبنية التحتية. Tom’s Hardware+1 |
+ H100 تتفوق في الأداء الكلي، خصوصًا في التدريب على موديلات كبيرة ومعقدة، بسبب عدد وحدات النوى (Tensor Cores)، البنية الدقيقة، وارتفاع عدد الترانزستور. Wikipedia+2Tom’s Hardware+2 |
| الذاكرة وعرض النطاق (Memory & Bandwidth) | + 910C توفر ذاكرة من نوع HBM3 بحجم 128GB في بعض التصاميم، وهي ميزة كبيرة للموديلات الكبيرة. nexgen-compute.com+1 − لكن عرض النطاق (bandwidth) أحيانًا أقل أو مشابه، ولم يتم دائماً الكشف عن الأرقام العالية مثل H100. nexgen-compute.com+1 |
+ H100 تستخدم HBM3 و/أو HBM3e، وتتمتع بعرض نطاق عالي جدًا يجعلها قوية جدًا في نقل البيانات والتعامل مع البينات الكبيرة والمتطلبات العالية. Wikipedia+1 |
| الكفاءة في استهلاك الطاقة (Power Efficiency) | + في بعض التصاميم، مثل 910C، استهلاك الطاقة يبدو أقل بكثير من H100، وهذا يعطي كفاءة أفضل (أداء-لكل-واط أفضل) في أنواع المهام التي لا تحتاج أقصى أداء خام. Wikipedia+3nexgen-compute.com+3Semiconductors Insight+3 − لكن عند بناء عُقُد ضخمة (clusters) مثل “CloudMatrix384” مع مئات الشرائح، التبريد، البُنى التحتية للاتصال، والكفاءة تنخفض، وقد يصعب المحافظة على الأداء لكل واط كما هو في الشرائح المنفردة. Tom’s Hardware+1 |
+ H100 معروفة بكونها تستهلك طاقة كبيرة جدًا خاصةً النماذج عالية الأداء (مثلاً TDP قد يكون إلى ~700 واط أو ما يقارب ذلك في صيغة SXM). Wikipedia+2Tom’s Hardware+2 − لكن الشركة أعطت الكثير من الانتباه لتحسين الأداء-لكل-واط، والبنية المحسنة، والبرمجيات والتبريد تساعد في تقليل الهدر. |
| البُنى التحتية والتوسع (Scalability & Deployment at Scale) | + هواوي تعمل على بناء أنظمة ضخمة، مثل CloudMatrix384، والتي تجمع مئات الشرائح Ascend وتنظمها ببنية اتصالات عالية-النطاق والربط بين الشرائح. arXiv+2Wikipedia+2 − لكن التحدي هو الربط بين الشرائح (interconnect)، التبريد، إدارة الطاقة، الاستقرار عند الأحمال الثقيلة جدًا، وتأخر بعض البنى البرمجية. − أيضًا، في بعض التقارير، الأداء في هذه الأنظمة الكاملة يكون أقل من المتوقع من حيث الأداء-لكل-واط. Tom’s Hardware+1 |
+ إنفيديا لديها بنية قوية جدًا للتوسع: NVLink / NVSwitch، أنظمة بيانات متقدمة تدعم الربط بين شرائح كثيرة، خبرة في التشغيل عند مقاييس ضخمة، ومجتمع مستخدمين كبير يجرب ويساهم في تحسينات. − الجانب السلبي هو أن الكلفة والتبريد والطاقة المطلوبة تصبح هائلة في الأنظمة الكبيرة جدًا. |
| البيئة البرمجية، الأدوات، الدعم | + هواوي تطوّر أدواتها مثل CANN، ومكتبات داعمة، وتحاول توافق مع أطر مثل PyTorch وTensorFlow، لكن لا تزال الأطر أقل نضوجًا من إنفيديا عالمياً. nexgen-compute.com+1 − نقص في بعض المكتبات الطرف الثالث، الأمثلة والدعم العالمي، بعض المشاكل في الاستقرار في بعض مهام التدريب الكبيرة. |
+ إنفيديا تستفيد من سنوات من التطوير في CUDA وcuDNN وTensorRT وغيرها، الكثير من الأبحاث والتطبيقات مكتوبة خصيصًا لها، عدد كبير من المطورين يستخدمونها. − قد تكون الأدوات مكلفة، واستيرادها أو استخدامها في بعض الدول يخضع لقيود صادرات، كما أن التحسينات في البرمجة قد تحتاج خبرة عالية. |
| السعر والتكلفة الإجمالية (Total Cost of Ownership) | + من المتوقع أن تكون أرخص في سياقات مثل الصين أو الدول التي تدعم الإنتاج المحلي، ومع الطلب المحلي الضخم، وكذلك في مهام الاستدلال (inference) أقل تكلفة من H100 في حالات كثيرة. − لكن التكلفة الإجمالية للنظام الكامل قد تزداد بسبب احتياجات التبريد، الربط، الدعم الفني، وربما الاستيراد لبعض المكونات. |
+ رغم أن القطعة نفسها باهظة الثمن، لكن بسبب الكفاءة العالية في بعض الاستخدامات (التدريب الكبير، بيئات تم تحسينها)، الأداء مقابل الكلفة قد يكون أفضل في بعض الحالات. − لكن التكلفة التشغيلية (الكهرباء، التبريد، البُنى التحتية) كبيرة جدًا خاصة عند نشر عدد كبير من الأجهزة. |
خطوة هواوي بإطلاق تقنية SuperPod المبنية على شرائح Ascend تعكس إصرار الصين على تقليل الاعتماد على الرقائق الأمريكية وخلق بدائل قادرة على المنافسة في سوق الذكاء الاصطناعي العالمي. ورغم أن إنفيديا ما زالت تتفوق من حيث الأداء الخام والبيئة البرمجية، إلا أن هواوي تراهن على التوسع الهائل وربط آلاف الشرائح لتعويض الفارق، مع تقديم كفاءة أفضل في استهلاك الطاقة وتكلفة أقل في بعض الاستخدامات.
المعركة بين الشركتين لم تعد مجرد سباق تقني، بل أصبحت أيضًا صراعًا استراتيجيًا يرتبط بالسيادة التكنولوجية والاقتصاد العالمي. ومع تسارع التطورات، قد نشهد في السنوات القليلة القادمة إعادة رسم لخريطة القوى في عالم الذكاء الاصطناعي، حيث تبرز هواوي كبديل جدي في مواجهة هيمنة إنفيديا.

