يعد الاتصال الفعال عامل تمكين رئيسيًا للمجموعات فائقة النطاق والإكساسكيل التي تحتوي على عشرات أو حتى مئات الآلاف من العقد – ولا تعد شبكة Ethernet التقليدية سوى شيء آخر.
وهذا ليس بسبب ذروة إنتاجيته في حد ذاته، ولكن بسبب بنيته والطريقة التي ينقل بها البيانات. ولحل هذا الاختناق، بدأت مجموعة من الشركات بقيادة Meta وMicrosoft وOracle في تطوير معيار اتصال مركز البيانات من الجيل التالي لتوفير شبكات ذات زمن وصول منخفض وشبكات واسعة النطاق ذات نطاق ترددي عالٍ عبر Ethernet وIP القياسيين. في منتصف عام 2025، تم تحديد مواصفات Ultra Ethernet 1.0.1 بواسطة اتحاد Ultra Ethernet، الذي يضم الآن أكثر من 100 شركة.
الحاجة إلى العقد… والاتصال
لطالما كانت شبكة إيثرنت بمثابة العمود الفقري لشبكات المؤسسات وتقنية الاتصال المفضلة لمراكز البيانات السحابية والآن مراكز بيانات الذكاء الاصطناعي. لكن بروتوكولات Ethernet التقليدية لم يتم تصميمها أبدًا للبيئات واسعة النطاق التي تحتوي على ما يصل إلى مليون عقدة. لكن الترا إيثرنت؟ نعم يمكنه التعامل مع ذلك.
يواجه التصميم الأساسي لشبكة Ethernet القياسية، وتحديدًا التسليم المرتقب لـ TCP والتحكم في الازدحام التفاعلي، صعوبات عندما تكون مئات الآلاف من الاتصالات نشطة في وقت واحد (وهو موقف شائع لأحمال عمل الذكاء الاصطناعي والحوسبة عالية الأداء). ومع تزايد أعداد العقد، تصطدم الحزم أو تتأخر بسهولة أكبر، ويجب أن تقوم المحولات بتتبع عدد كبير جدًا من التدفقات، مما يتسبب في ازدحام زائف وزمن انتقال غير مستقر. تعتمد Ethernet أيضًا على الموثوقية الكبيرة للبرامج وتقديم أفضل جهد، وهو أمر جيد بما يكفي لشبكات المؤسسات ولكنه يضيف زمن الوصول والحمل الزائد في مجموعات الذكاء الاصطناعي أو HPC المتزامنة.
تعتمد أجهزة الكمبيوتر العملاقة عمومًا على روابط بينية مخصصة مثل Infiniband، وهي تقنية تتميز بالتحكم في التدفق على مستوى الأجهزة، والتوجيه الحتمي، وموثوقية إدارة الأجهزة. باستخدام هذه الاتصالات، تعتني بطاقة NIC نفسها بإقرارات الحزم، وإعادة الإرسال، واسترداد الأخطاء، مما يفتح الأبواب أمام مجموعات تحتوي على المزيد من العقد. لكنها مملوكة ومكلفة، وبالتالي لم يتم أخذها في الاعتبار بالنسبة للجيل التالي من مراكز بيانات الذكاء الاصطناعي والحوسبة عالية الأداء عندما بدأت Meta وMicrosoft وOracle عملها في عام 2022.
بدلاً من اعتماد حل موجود، أنشأت UEC معيارًا جديدًا تمامًا للشبكات يعيد تشكيل نقل البيانات عن طريق إزالة المتطلبات التقليدية لوصول الحزم بالترتيب. يقدم المعيار الجديد بنية جديدة تمامًا — بدءًا من البرامج وحتى الطبقة المادية — مصممة للاتصالات غير المنظمة وغير المتصلة عبر البنية التحتية الحالية لشبكة Ethernet وIP. والنتيجة هي حزمة نقل تتسم بالكفاءة والقابلية العالية للتطوير والتي تتفوق في الأداء على تطبيقات RDMA القديمة وتظل متوافقة مع الأنظمة البيئية الحالية لأجهزة وبرمجيات مراكز البيانات (على سبيل المثال، IEEE 802.1 و802.3 وIETF RFC).
Ultra Ethernet: أهداف التصميم
كان الهدف الرئيسي للكونسورتيوم هو حل المشكلات طويلة الأمد الموروثة من تقنيات RDMA مثل RoCE v2؛ تم تحسين هذه البروتوكولات من أوائل العقد الأول من القرن الحادي والعشرين للشبكات المطلوبة ذات زمن الوصول المنخفض، لكنها كانت تفتقر إلى تعدد المسارات والتحكم الفعال في الازدحام والأمان المضمن.
تعمل آليات الطلب الصارمة الخاصة بـ RDMA على إجبار جميع الحزم على اتباع مسار واحد، مما يجعل الشبكات عرضة للازدحام الزائف وموازنة التحميل غير الفعالة وغير فعالة بشكل خاص في التعامل مع أعباء العمل المتقطعة التي نراها في مجموعات الذكاء الاصطناعي والحوسبة عالية الأداء (HPC) اليوم. ونتيجة لذلك، يمكن أن تفقد مجموعة الذكاء الاصطناعي الحديثة التي تتكون من عشرات الآلاف من وحدات معالجة الرسومات ما يقرب من 30% من الأداء بسبب عيوب شبكة إيثرنت المعاصرة.
تم تصميم UEC لتقسيم مسؤوليات الشبكة إلى أجزاء أكثر وضوحًا، وفصل الموثوقية عن الدلالات. وكما قال مهندسو البروتوكول، لا ينبغي أن تكون الاتصالات ثقيلة الوزن أو دائمة أو مرئية برمجيًا. بدلاً من وجود نظام واحد يتعامل مع كل شيء – سلامة الرسالة، والتحكم في التدفق، وحالة الاتصال – تم تقسيم هذه الوظائف الآن: تعتني طبقة الموثوقية بتسليم الحزمة، والإقرارات، وإعادة الإرسال، بينما تتعامل الطبقة الدلالية مع التفاصيل ذات المستوى الأعلى مثل الرسائل والعناوين والعلامات.
يتيح هذا التصميم وصول الحزم خارج الترتيب دون إرباك البرنامج الموجود فوقها. علاوة على ذلك، نظرًا لأن التغيير يحدث تحت مستوى التطبيق، يمكن للتطبيقات الحالية والبرامج الوسيطة وشبكات Ethernet/IP الاستمرار في العمل كما هي، مما يبسط إلى حد كبير نشر Ultra Ethernet في مراكز البيانات الحالية.
التطور المصمم يتحول إلى ثورة
مثل معجنات نابليون، تحتوي تقنية Ultra Ethernet على العديد من الطبقات التي تجتمع لتشكل شيئًا أكبر من مجموع أجزائها. لقد أحدثت خطواتهم التطورية المصممة خصيصًا قفزة كبيرة للأمام في مجال تكنولوجيا الشبكات التي تهدف إلى نشر الذكاء الاصطناعي والحوسبة عالية الأداء على نطاق واسع.
الطبقة المادية تظل شبكة Ultra Ethernet مبنية على إشارات وبصريات IEEE 802.3 Ethernet القياسية، مما يعني أنها تستخدم نفس الكابلات وأجهزة الإرسال والاستقبال ومنافذ التبديل المنتشرة بالفعل في مراكز البيانات اليوم. لكن الطبقة المادية لـ UE تقدم تصحيحًا محسنًا للأخطاء الأمامية (FEC)، وتدريبًا على الارتباط منخفض زمن الوصول، وتوقيتًا أكثر دقة ومواصفات الارتعاش، وقياسًا أفضل عن بعد (لمنح المشغلين رؤية أكبر لسلامة الإشارة وصحة الارتباط) وتحسين التزامن لعمليات نشر الذكاء الاصطناعي والحوسبة عالية الأداء على نطاق واسع. يمكن القول إن التحسينات الرئيسية لـ Ultra Ethernet موجودة في طبقات الارتباط والنقل.
طبقة الارتباط يدير الاتصالات المباشرة بين المحولات ومحولات الشبكة ويضمن سلامة الإشارة وزمن الوصول المنخفض والأداء الموثوق عبر مساحات مركز البيانات. تقدم طبقة الارتباط الخاصة بـ Ultra Ethernet ثلاث ترقيات اختيارية: التحكم في التدفق المعتمد على الائتمان (CBFC) يحافظ على ثبات تدفق البيانات بين الأجهزة عن طريق تجنب التحميل الزائد للمخزن المؤقت؛ تعمل إعادة محاولة طبقة الارتباط (LLR) على إصلاح أخطاء الإرسال بسرعة؛ ويمنع تقطيع الحزم (PT) فقدان الحزم. فهي تساعد معًا على منع الازدحام وتقليل فقدان البيانات والحفاظ على موثوقية أداء الشبكة وقابلية التنبؤ به.
ال طبقة النقل هو جوهر Ultra Ethernet لأنه يتيح نقل البيانات بسرعة وموثوقية وآمنة بطريقة خارجة عن النظام بين الأنظمة. تستخدم الطبقة بروتوكول Ultra Ethernet Transport (UET)، الذي ينقسم إلى أربعة أجزاء – الدلالي، وتسليم الحزم، وإدارة الازدحام، وأمن النقل – التي تدير كيفية إرسال الرسائل، والحفاظ على الحزم بالترتيب، والتحكم في حركة مرور الشبكة، وحماية البيانات من خلال التشفير. حتى عندما تتخذ الحزم مسارات مختلفة وتصل خارج الترتيب، يقوم النظام بإعادة تجميعها على الفور، وبالتالي الحفاظ على زمن الوصول منخفضًا والإنتاجية العالية والأداء ثابتًا عبر مجموعات الذكاء الاصطناعي والحوسبة عالية الأداء الضخمة.
طبقة التخزين يعد Ultra Ethernet بمثابة جهد للتكامل والتحسين أكثر من كونه إعادة تصميم كاملة. وهو يعتمد على بروتوكولات تخزين Ethernet الحالية مثل NVMe-over-Fabrics وRDMA وRoCE بدلاً من استبدالها. ومع ذلك، فهو يعمل على تحسين البروتوكولات لتتناسب بشكل أفضل مع مجموعات الذكاء الاصطناعي الكبيرة من خلال دمجها بإحكام مع UET لتقليل تأخير الإدخال/الإخراج وتحسين الاتساق عبر آلاف العقد لتوصيل الشبكات عالية السرعة بالبنية التحتية للتخزين بشكل أكثر كفاءة.
أما بالنسبة ل طبقة الإدارةتعمل تقنية Ultra Ethernet على تحويل الإدارة من تكوين الجهاز الأساسي إلى تنسيق شبكي آلي على مستوى النسيج لأنظمة الذكاء الاصطناعي والحوسبة عالية الأداء الكبيرة. وللقيام بذلك، فهو يشتمل على أدوات تلقائية لاكتشاف الأجهزة، ورسم خرائط هيكل الشبكة، ومراقبة الأداء، مما يمكّن المسؤولين من تشخيص المشكلات وإصلاحها بسرعة عبر آلاف العقد المترابطة.
ال طبقة البرمجيات (أو بالأحرى كومة البرمجيات) في Ultra Ethernet – الذي يربط بين التطبيقات والشبكات – لا يختلف جذريًا عن ذلك الموجود في Ethernet التقليدية، ولكنه تم توسيعه بشكل كبير لجعل Ethernet أكثر قابلية للبرمجة والاستخدام لعمليات نشر الذكاء الاصطناعي والحوسبة عالية الأداء (HPC). التحسين الرئيسي هو أن SL يدمج الآن Libfabric، وهي واجهة برمجة تطبيقات شبكة مفتوحة المصدر مع عمليات غير مرتبة تسمح للبرامج بإرسال البيانات مباشرة من الذاكرة إلى واجهة الشبكة، وتجاوز وحدة المعالجة المركزية وتحسين الأداء.
بالإضافة إلى ذلك، تدعم طبقة البرامج OpenConfig لتوحيد إدارة الشبكة ولغة نمذجة بيانات YANG، التي تحدد كيفية تنظيم بيانات التكوين. بشكل عام، تحافظ طبقة البرامج على التوافق الأساسي لشبكة Ethernet ولكنها تضيف إمكانية البرمجة وتخفض زمن الوصول وتحسن الكفاءة الإجمالية.
إدارة الترا إيثرنت
كما هو الحال مع شبكة Ethernet التقليدية، تتم إدارة تطور Ultra Ethernet من خلال نظام بيئي راسخ من مؤسسات المعايير التي تشكل اتحاد Ultra Ethernet. ومن بين هذه المنظمات أ مجموعة عمل الامتثال تضع المعايير الرسمية وإجراءات الاختبار للتأكد من أن جميع أجهزة وبرامج Ultra Ethernet تعمل معًا بشكل صحيح وتلبي مستويات الأداء المطلوبة. وهناك أيضا فريق عمل الإدارة، الذي ينشئ أدوات ونماذج لتكوين شبكات UE ومراقبتها والتحكم فيها حتى يتمكن المشغلون من إدارة الأقمشة الكبيرة بكفاءة. وأخيراً هناك أ مجموعة عمل الأداء والتصحيح لتحديد المعايير وأدوات التشخيص لاختبار وقياس واستكشاف أنظمة UE وإصلاحها لضمان الموثوقية العالية والأداء المتسق.
عمل قيد التقدم
في حين أن مواصفات UEC 1.0.1 تحدد البنية الأساسية ونماذج النقل والارتباط، فإن التكنولوجيا لا تزال في مهدها من حيث التحقق من صحتها واعتمادها وتطويرها. يتم اختبار معظم ابتكاراتها – مثل بروتوكول Ultra Ethernet Transport، وإدارة الازدحام، وتقطيع الحزم، وغيرها الكثير – وتحسينها ودمجها في نماذج الأجهزة والبرامج.
عندما يتعلق الأمر بالأجهزة، هناك بالفعل بطاقات شبكة يُقال إنها جاهزة لـ UEC (بدلاً من متوافقة مع UEC 1.0)، مثل Pensando Pollara 400 AI NIC من AMD، مما يعني أنها لا تدعم في الوقت الحالي جميع ميزات المواصفات. في حين أن البطاقة تدعم ميزات مثل Intelligent Packet Spray، ومعالجة الحزم خارج الترتيب، وإعادة الإرسال الانتقائي، والتحكم في الازدحام حسب المسار، فإن مطورها لم يذكر ميزات مستوى الارتباط مثل Packet Trimming، أو التحكم في التدفق المعتمد على الائتمان (CBFC)، أو دعم إعادة محاولة طبقة الارتباط المتقدمة (LLR). ولكن مرة أخرى، هذه إمكانيات اختيارية في الوقت الحالي.
يواصل الكونسورتيوم تطوير الإصدارات والإضافات المستقبلية لمواصفات Ultra Ethernet، على الرغم من أن الوقت وحده هو الذي سيحدد متى سيتم تقديمها رسميًا.
يتبع أجهزة توم على أخبار جوجل، أو أضفنا كمصدر مفضل، للحصول على آخر الأخبار والتحليلات والمراجعات في خلاصاتك.

التعليقات