UALink (اختصار لـ Ultra Accelerator Link) هي تقنية ربط بيني قادمة مصممة لتمكين الاتصال عالي السرعة وزمن الوصول المنخفض بين مسرعات الذكاء الاصطناعي (ASICs وGPUs وFPGAs وNPUs وXPUs) وأجهزة الحوسبة الأخرى عبر مجال منطقي قابل للتوسيع. ويرى الكثيرون أنه طريق مهم للأمام لمستقبل مراكز بيانات الذكاء الاصطناعي نظرًا لأدائه المخطط له وتكلفته ومزايا كفاءة الطاقة، ناهيك عن أنه كمعيار مفتوح، فإنه سيقلل من تقييد البائعين.
في عام 2025، نشر اتحاد UALink المراجعة 1.0 لمواصفات UALink، مما يمثل نقطة يمكن بعدها لمصممي الأجهزة تنفيذ التكنولوجيا رسميًا في مسرعات AI/HPC الخاصة بهم وتبديل ASICs المطلوبة لبناء حجرات الذكاء الاصطناعي مع ما يصل إلى 1024 مسرعًا. ولكن على الرغم من أن تقنية UALink مدعومة على نطاق واسع من قبل الصناعة، ومواصفاتها التي تحدد الاتصالات من مسرع إلى مسرع متاحة الآن، فإن اعتمادها على نطاق واسع لا يزال على بعد عدة سنوات.
ما هو UALink؟
سيمكن UALink المبرمجين من التعامل مع مسرعات متعددة مثل معالج واحد، مع مجموعة كبيرة من الذاكرة (أو على الأقل تمكين التوازي بأقل جهد من المطورين) وتبسيط اتصالات الشبكة بين المعالجات إلى حد كبير.
تم تصميم UALink كتقنية منافسة لربط NVLink الخاص بشركة Nvidia والذي يدعمه نطاق واسع من اللاعبين في الصناعة، بما في ذلك AMD وArm وAWS وBroadcom وCadence وIntel وGoogle وMarvell وMeta وMicrosoft وSynosys، على سبيل المثال لا الحصر.
تم تصميم مواصفات UALink 200G 1.0 لدعم ما يصل إلى 1,024 مسرعًا لكل مجال (أو جراب) بسرعة 212.5 GT/s، مما يتيح الوصول المباشر للذاكرة بين المسرعات باستخدام التحميل/التخزين البسيط والعمليات الذرية، وبالتالي يتصرف كنظام واحد. تم إنشاء UALink حول مجموعة بروتوكولات خفيفة الوزن تتضمن طبقة بروتوكول (UPLI)، وطبقة المعاملات (TL)، وطبقة ارتباط البيانات (DL)، والطبقة المادية (PL).
في الطبقة المادية، يعيد UALink استخدام إشارات Ethernet PHY القياسية (مثل 100GBASE-KR1، و200GBASE-KR2، و800GBASE-KR4) لتبسيط التنفيذ، ولكنه يقدم إطارات مخصصة، وتصحيح الأخطاء الأمامية (FEC)، وتحسينات زمن الوصول. يعمل كل ممر تسلسلي بسرعة 212.5 جيجا بايت/ثانية، مما يوفر 200 جيجا بايت/ثانية فعالة من البيانات لكل حارة بعد تحميل FEC. وفي الوقت نفسه، يتم دعم تكوينات الروابط x1 أو x2 أو x4 لتمكين ما يصل إلى 800 جيجا بايت/ثانية من عرض النطاق الترددي لكل اتجاه لكل رابط. تقوم طبقة DL بتنسيق حركة المرور إلى 640 بايت من FLITs مع CRC ورؤوس المقاطع، بينما تقوم طبقة TL بضغط رسائل الطلب والاستجابة في حمولات من 4 إلى 16 بايت لخفض زمن الاستجابة والحفاظ على منطقة القالب تحت المراقبة.
وفقًا لمطوري UALink، يضمن البروتوكول زمن وصول محدد أقل من 1 ميكروثانية ويحقق استخدامًا فعالاً لعرض النطاق الترددي بنسبة تصل إلى 93%، وهو معدل مرتفع جدًا. لا يحل UALink محل Ethernet أو PCIe أو CXL، ولكنه مصمم للتعايش مع هذه التقنيات داخل عقد النظام، ويعمل فقط على حركة مرور نظير إلى نظير بين المسرعات.
عندما يتعلق الأمر ببنية النظام، يتمحور الأمر حول محولات UALink (ULS) التي تتيح الاتصال المسرع من نقطة إلى نقطة داخل الرفوف وعبرها. يجب أن تدعم رموز التبديل هذه التسليم بدون فقد البيانات، وسلوك النسيج غير المحظور، وعزل الكبسولة الافتراضية. يتم تعيين معرف توجيه 10 بت لكل مسرع (وبالتالي الحد من 1024 مسرعًا لكل حاوية)، وتحتفظ المحولات بجداول التوجيه لكل منفذ لدعم طبولوجيا التوسع. يتضمن المعيار آليات احتواء الأخطاء واكتشاف الأخطاء والعزل التي تحد من حالات الفشل في حاوية افتراضية واحدة دون التأثير على الآخرين في حاوية التوسعة “الكبيرة”.
على الرغم من وجود الإصدار 1.0 من UALink، إلا أن التكنولوجيا لا تزال قيد التقدم حيث من المتوقع أن تضيف الإصدارات المستقبلية تماسك الذاكرة (المدعوم بالفعل بواسطة NVLink) وميزات المحاكاة الافتراضية.
لماذا يوالينك؟
اليوم، يسمح NVLink من Nvidia للشركة وشركائها ببناء وحدات تحتوي على ما يصل إلى 576 وحدة معالجة رسوميات (حزمة GPU)، مما يتيح توسيع نطاق الأحجام العالمية التي تتميز بعرض نطاق ترددي عالٍ وزمن وصول منخفض. في المقابل، يقتصر الحجم العالمي المتزايد لمسرعات سلسلة Instinct MI300 من AMD (أو وحدات معالجة الرسومات Nvidia's H100) على ثمانية وحدات معالجة رسوميات لكل صندوق، حيث يتم تمكين الاتصال خارج الصندوق عن طريق Ethernet.
تم تحسين Ethernet، حتى عند 400G/800G مع RDMA (RoCE)، بشكل أساسي للاتصالات القائمة على الحزم والواسعة النطاق، وليس لعمليات التحميل/التخزين ذات زمن الوصول المنخفض ودلالات الذاكرة والتحميل/التخزين المطلوبة للتوصيلات البينية لتسريع الذكاء الاصطناعي. على النقيض من ذلك، يوفر UALink وصولاً مباشرًا للذاكرة بين المسرعات، ويدعم الذرات، ويحافظ على دلالات الترتيب عبر نقاط النهاية. حتى مع التحسينات المختلفة، تقدم شبكة Ethernet زمن وصول أعلى ذهابًا وإيابًا (~2 μs+) وحملًا إضافيًا لمجموعة البرامج، وهو الأمر الذي يحد من شبكة Ethernet حتى بالنسبة لمراكز البيانات الحديثة. على النقيض من ذلك، يستهدف UALink زمن استجابة أقل من 1 ميكروثانية ذهابًا وإيابًا، ويدعم التحكم في التدفق بدون فقدان، ويعمل مع FLITs ذات الحجم الثابت والتوجيه المستند إلى المعرف.
حتى محولات Ethernet المتطورة، مثل Tomahawk Ultra من Broadcom، تتطلب بطاقات NIC لترجمة أوامر التحميل/التخزين إلى أوامر RDMA، مما يضيف زمن الوصول والتعقيد الذي يتجاوزه UALink من خلال دعم مراسلة الأجهزة الأصلية.
بناء النظام البيئي UALink
نظرًا لأن اتحاد UALink يضم أكثر من 90 عضوًا، فمن المعقول افتراض أن هناك العشرات من الشركات التي تعمل حاليًا على العديد من مسرعات الذكاء الاصطناعي والحوسبة عالية الأداء بدعم من UALink. بالإضافة إلى ذلك، تعمل شركات الاتصال على المحولات. أخيرًا، تقدم Synopsys UALink IP وPHY منذ عام تقريبًا، مما يبسط تنفيذ التكنولوجيا إلى حد كبير.
عادةً ما يستغرق دمج IP وPHY الجاهزين من موردين مثل Synopsys أو Cadence في مسرع الذكاء الاصطناعي أو النظام على الشريحة من 12 إلى 24 شهرًا، اعتمادًا على مدى تعقيد الشريحة ونضج المشروع وبعض العوامل الأخرى الخاصة بالتطوير. لذلك، قد يستغرق الأمر أشهرًا أو أرباعًا للمعالجات التي تستخدم UALink. يقول سينوبسيس أن الاهتمام بالتكنولوجيا كبير.
وقال بريانك شوكلا، مدير إدارة المنتجات لـ HPC IP في Synopsys: “يعد UALink معيارًا مفتوحًا حقًا يجذب اهتمامًا كبيرًا من كل من شركات التسريع وشركات التبديل”. أجهزة توم. “لقد نجحنا في تسليم حل Synopsys UALink 200G IP الخاص بنا، والذي يتضمن كلاً من وحدة التحكم وPHY IP، للعملاء في أسواق التبديل والمسرعات.”
من بين الشركات التي أكدت بالفعل تطوير المعالجات باستخدام UALink هي AMD (Instinct MI400، MI500-series) وMarvell (كخيار للسيليكون المخصص الذي يستهدف المتوسعين الفائقين)، على الرغم من توقع أن يتم دعم التكنولوجيا من قبل الآخرين قريبًا. ومع ذلك، يعتمد نشر محولات UALink عبر سلسلة MI400 على مدى السرعة التي يمكننا بها رؤية UALink لتحويل السيليكون في عام 2026. وفي غياب مثل هذه المحولات، قد تضطر سلسلة MI400 إلى استخدام UALink-over-Ethernet، وهي حالة استخدام أقل من مثالية.
في الواقع، يبدو أن توفر المحولات يمكن أن يكون العامل الرئيسي الذي يبطئ اعتماد تقنية UALink.
تعمل Astera Labs حاليًا على تطوير مفاتيح النسيج الذكية ومكيفات الإشارة وأجهزة التحكم والمزيد. وتتوقع الشركة تقديم حلول UALink الأولى في عام 2026 لحل تحديات الاتصال واسعة النطاق، لكنها لم تكشف عما سيأتي بعد ذلك. كما تلاحظ أن الاهتمام بالتكنولوجيا كبير.
قال كريس بيترسن، زميل التكنولوجيا وهندسة الحلول في Astera Labs: “على الرغم من أنني لا أستطيع التحدث إلى جداول زمنية محددة لمنتج ما، إلا أن ما يمكنني قوله هو أن زخم النظام البيئي UALink قد تجاوز توقعاتنا منذ إصدار مواصفات 1.0 في أبريل”. أجهزة توم. “يخبرنا عملاؤنا – وخاصة أصحاب التوسع الفائق – باستمرار بثلاثة أشياء تدفع قرارات البنية التحتية الخاصة بهم: إنهم بحاجة إلى معايير مفتوحة مع دعم متعدد البائعين، ويركزون على التكلفة الإجمالية للملكية، ويحتاجون إلى وقت أسرع للتسويق لنشر نطاق الحوسبة الذي تتطلبه تطبيقات الذكاء الاصطناعي المتطورة.”
على عكس Astera Labs، تبدو Broadcom – التي تطور معالجات ذكاء اصطناعي مخصصة لعملائها بالإضافة إلى أجهزة اتصالات مختلفة لمراكز البيانات – أكثر تحفظًا بعض الشيء، على الرغم من أنها عضو مؤسس في مجموعة UALink Promotions Group. لا تستطيع الشركة التحدث عما إذا كانت تقوم ببناء مسرعات تدعم UALink لعملائها، وتقوم بوضع حلول Tomahawk Ultra Ethernet الخاصة بها لتوسيع نطاق الاتصال بمسرعات الذكاء الاصطناعي.
أخبرنا متحدث باسم Broadcom: “يمكننا القول إننا نرى زخمًا هائلاً وراء استخدام Ethernet لتوسيع النطاق”. “تم تصميم Tomahawk Ultra خصيصًا لتوسيع نطاق الذكاء الاصطناعي المستند إلى Ethernet وهو متاح اليوم.”
هل هناك طريق مسدود؟
على الرغم من أن مواصفات UALink 1.0 جاهزة ويمكن استخدامها لبناء أجهزة التبديل، إلا أن التكنولوجيا تفتقد العديد من الأشياء، بما في ذلك مواصفات 128G DL/PL (كان من المتوقع في يوليو 2025، ولكن لا توجد معلومات عما إذا كان قد تم الانتهاء منها)، وIn-Network Collectives (INC، كان من المتوقع في ديسمبر 2025) تسريع الأجهزة للعمليات الجماعية، ومواصفات شريحة UCIe PHY 128G/200G.
لا تعتبر أي من هذه الميزات إلزامية لبناء أجهزة التبديل، لذا من الممكن إنشاء محول ASIC متوافق مع المواصفات ضمن UALink 1.0. ومع ذلك، فإن مواصفات 128G DL/PL ستكون مهمة لتصميمات المحولات من الجيل التالي أو ذات المعدل المختلط أو المتوافقة مع الأمام والتي تدعم معدل نقل بيانات أبطأ. وفي الوقت نفسه، يتعين على INC دعم التدريب واسع النطاق بكفاءة والتفاعل مع الأجهزة المستقبلية. بدون INC، يجب تنفيذ العمليات الجماعية في البرنامج أو عبر بطاقات الشبكة، مما يزيد زمن الوصول ويعوق مزايا UALink.
وقال بيترسن: “يعمل اتحاد UALink بنشاط على مواصفات إضافية، بما في ذلك الإدارة وتكامل شرائح UCIe IO والمجموعات داخل الشبكة التي من شأنها تعزيز النظام البيئي لتلبية هذه المطالب”. “مع وجود أكثر من 85 شركة عضو تقود خريطة طريق المواصفات الموسعة هذه، تستجيب UALink لحاجة السوق الحقيقية إلى حلول موسعة يمكنها مواكبة النمو الهائل للذكاء الاصطناعي.”
ربما لا ترغب بعض الشركات التي تعمل حاليًا على الأجهزة الداعمة لـ UALink في الالتزام بخريطة طريق معينة قبل أن يتم دعم كافة الميزات بواسطة المواصفات. ومع ذلك، فإن أهمية المؤتمر الوطني العراقي قد لا تكون بهذه الأهمية.
وقال أحمد دانيش، نائب الرئيس المساعد لإدارة المنتجات في Astera Labs: “لا يتم نشر INC بشكل شائع عبر جميع التطبيقات، ونرى أيضًا أن العديد من الحلول الحالية التي يمكن أن تستخدم INC يتم نشرها دون تمكين INC”. أجهزة توم. “أخذ مجلس إدارة UALink Consortium هذا الأمر في الاعتبار عند تحديد UALink 1.0، ويرى المتبنون الأوائل أولوية أعلى لتقديم أداء أعلى وتكلفة إجمالية أقل للملكية من خلال بروتوكول UALink الدلالي للذاكرة المصمم لهذا الغرض. ومن غير المتوقع أن يؤثر الافتقار إلى مواصفات INC في UALink 1.0 على جداول إطلاق أجهزة UALink، لكن الاتحاد يواصل تطوير المواصفات ويعمل بنشاط على INC لتقديم قيمة أكبر مع UALink.”
التبني سوف يستغرق وقتا
UALink هو معيار ربط واعد ومفتوح مصمم لتمكين الاتصال عالي السرعة ومنخفض الكمون بين مسرعات الذكاء الاصطناعي والذي حصل على دعم من أكثر من 90 شركة.
ومع ذلك، في حين أكدت AMD وMarvell على تطوير المعالج المستند إلى UALink، وتوفر Synopsys بالفعل وحدة تحكم وPHY IP، فإن النشر على نطاق واسع سيستغرق وقتًا بسبب دورات التكامل والنقص الحالي في المحولات المتوافقة مع UALink.
على الرغم من أن التحسينات المستقبلية مثل In-Network Collectives (INC) ومواصفات 128G PHY ليست مطلوبة لبناء أجهزة متوافقة، إلا أن غيابها قد يؤدي إلى تأخير الالتزامات الأوسع، حيث قد تنتظر بعض الشركات حتى يتم الانتهاء من هذه الميزات قبل قفل تطوير أجهزة UALink الخاصة بها وطرحها في السوق. ومع ذلك، تتوقع Astera Labs أن تصل المنتجات الأولى التي تدعم UALink إلى السوق في وقت ما هذا العام.

التعليقات