
- يقوم النظام بربط المرافق البعيدة لتشغيل أعباء العمل التدريبية الضخمة بشكل مستمر
- تعمل الألياف عالية السرعة على إبقاء وحدات معالجة الرسومات نشطة عن طريق تجنب اختناقات البيانات البطيئة
- تعمل كثافة الرقائق المكونة من طابقين على زيادة قوة الحوسبة مع تقليل زمن الوصول بين الحاملات
كشفت شركة مايكروسوفت النقاب عن أول مصنع فائق للذكاء الاصطناعي، يربط مراكز بيانات الذكاء الاصطناعي الكبيرة في ويسكونسن وأتلانتا من خلال شبكة ألياف مخصصة مصممة لحركة بيانات التدريب عالية السرعة.
يضع التصميم الرقائق قريبة من بعضها البعض عبر طابقين لزيادة الكثافة وتقليل التأخر.
كما أنها تستخدم أنظمة كابلات وأنظمة سائلة واسعة النطاق مرتبة لإدارة الوزن والحرارة التي تنتجها مجموعات كبيرة من الأجهزة.
شبكة مصممة للتدريب على النماذج واسعة النطاق
في منشور بالمدونة، قالت Microsoft إن هذا التكوين سيدعم أعباء عمل الذكاء الاصطناعي الواسعة التي تختلف عن المهام الأصغر والأكثر عزلة الشائعة في البيئات السحابية.
وقال أليستير سبيرز، المدير العام لشركة Microsoft الذي يركز على البنية التحتية لـ Azure: “يتعلق الأمر ببناء شبكة موزعة يمكن أن تكون بمثابة كمبيوتر عملاق افتراضي لمواجهة أكبر التحديات في العالم”.
“إن السبب الذي يجعلنا نطلق على هذا المصنع اسم “المصنع الفائق للذكاء الاصطناعي” هو أنه يدير مهمة واحدة معقدة عبر ملايين القطع من الأجهزة… وهو ليس مجرد موقع واحد لتدريب نموذج الذكاء الاصطناعي، بل هو عبارة عن شبكة من المواقع التي تدعم تلك الوظيفة الواحدة.”
يقوم نظام AI WAN بنقل المعلومات عبر آلاف الأميال باستخدام ألياف مخصصة، جزء منها تم بناؤه حديثًا وجزء تم إعادة استخدامه من عمليات الاستحواذ السابقة.
تم تعديل بروتوكولات الشبكة وبنيتها لتقصير المسارات والحفاظ على حركة البيانات بأقل قدر من التأخير.
تدعي مايكروسوفت أن هذا يسمح للمواقع البعيدة بالتعاون في نفس عملية التدريب النموذجية في الوقت الفعلي تقريبًا، حيث يساهم كل موقع بحصته من العمليات الحسابية.
ينصب التركيز على الحفاظ على النشاط المستمر عبر أعداد كبيرة من وحدات معالجة الرسومات بحيث لا تتوقف أي وحدة مؤقتًا أثناء انتظار النتائج من موقع آخر.
قال سكوت جوثري، نائب الرئيس التنفيذي لشركة Cloud + AI في Microsoft: “لا تقتصر الريادة في مجال الذكاء الاصطناعي على إضافة المزيد من وحدات معالجة الرسومات فحسب، بل تتعلق أيضًا ببناء البنية التحتية التي تجعلها تعمل معًا كنظام واحد”.
تستخدم Microsoft تخطيط Fairwater لدعم أنظمة الرف عالية الإنتاجية، بما في ذلك وحدات Nvidia GB200 NVL72 المصممة للتوسع في مجموعات كبيرة جدًا من وحدات معالجة الرسومات Blackwell.
تقوم الشركة بإقران هذا الجهاز بأنظمة تبريد سائلة ترسل سائلًا ساخنًا إلى خارج المبنى وتعيده عند درجات حرارة منخفضة.
تذكر Microsoft أن التبريد التشغيلي لا يستخدم أي مياه جديدة تقريبًا، باستثناء الاستبدال الدوري عند الحاجة للتحكم الكيميائي.
يعكس موقع أتلانتا تخطيط ولاية ويسكونسن، مما يوفر بنية متسقة عبر مناطق متعددة مع ظهور المزيد من المرافق عبر الإنترنت.
قال مارك روسينوفيتش، المدير التنفيذي للتكنولوجيا، ونائب رئيس أمن المعلومات، والزميل التقني في Microsoft Azure: “لإجراء تحسينات في قدرات الذكاء الاصطناعي، تحتاج إلى بنية تحتية أكبر وأكبر لتدريبه”.
“إن حجم البنية التحتية المطلوبة الآن لتدريب هذه النماذج لا يقتصر على مركز بيانات واحد فقط، وليس مركزين، بل مضاعفات ذلك.”
تضع الشركة هذه المواقع على أنها مصممة خصيصًا لتدريب أدوات الذكاء الاصطناعي المتقدمة، مستشهدة بعدد المعلمات المتزايد ومجموعات بيانات التدريب الأكبر كضغوط رئيسية تؤدي إلى التوسع.
تشتمل المرافق على إكسابايت من التخزين وملايين مراكز وحدة المعالجة المركزية لدعم المهام حول سير عمل التدريب الأساسي.
تقترح Microsoft أن هذا النطاق ضروري لشركاء مثل OpenAI وفريق الذكاء الاصطناعي الفائق الخاص بها لمواصلة تطوير النموذج.
اتبع TechRadar على أخبار جوجل و أضفنا كمصدر مفضل للحصول على أخبار الخبراء والمراجعات والآراء في خلاصاتك. تأكد من النقر على زر المتابعة!
وبالطبع يمكنك أيضًا اتبع TechRadar على TikTok للحصول على الأخبار والمراجعات وفتح الصناديق في شكل فيديو، والحصول على تحديثات منتظمة منا على واتساب أيضاً.

التعليقات