إذا دخلت إلى أي مركز بيانات حديث يعمل بالذكاء الاصطناعي، فسوف تصاب بالحرارة على الفور. حتى قبل أن تضع عينك على الرفوف، ستشعر بإخراج صفوف تلو صفوف من الخوادم التي تدفع الهواء عبر رفوف كثيفة بشكل متزايد والتي لم يتم تصميمها أبدًا للمعالجات التي تستمد القوة المطلقة اللازمة لتشغيل نماذج الذكاء الاصطناعي الضخمة. وبضرب ذلك عبر مجموعات التدريب الكثيفة، يصبح الغلاف الحراري واحدًا من أعظم القيود الهندسية اليوم.
الآن، وفقا لتقرير من جنوب الصين مورنينج بوستتعمل الصين على تسريع الاستثمارات في تكنولوجيا التبريد السائل. أعلنت العشرات من الشركات الصينية – بما في ذلك إنفيكول، التي تضاعفت أسهمها أكثر من ثلاثة أضعاف خلال العام الماضي – عن خطط للتوسع في أنظمة التبريد السائل لمنع ارتفاع درجة حرارة رفوف الذكاء الاصطناعي. مع استخدام الأظرف الحرارية، لا تعد هذه مشكلة فريدة بالنسبة لمراكز البيانات الصينية أيضًا.
تبريد الهواء لن يقطعه
تعمق أكثر مع TH Premium: الذكاء الاصطناعي ومراكز البيانات
على سبيل المثال، يعمل Nvidia's B200 بأكثر من 1000 واط لكل معالج، ومنصة GB200 NVL72 على نطاق الرف، والتي تدمج 72 وحدة معالجة رسوميات Blackwell و36 وحدة معالجة مركزية Grace، تأتي في تكوين مبرد بالسائل كمعيار قياسي وبدافع الضرورة.
مع استمرار قوة التصميم الحراري للرقاقة في الارتفاع، يواجه تبريد الهواء حدين. أولاً، تقيد السعة الحرارية الحجمية للهواء مقدار الطاقة الحرارية التي يمكن إزالتها لكل وحدة زمنية دون دفع تدفق الهواء واستخدام الطاقة إلى مستويات غير عملية. ثانيًا، تؤدي متطلبات تدفق الهواء العالية إلى تعقيد كثافة الحامل وتصميم المنشأة بشكل عام. عند كثافات متعددة الكيلووات لكل حامل، تصبح أنظمة تبريد الهواء هذه غير فعالة بشكل متزايد.
وعلى النقيض من ذلك، يوفر السائل سعة حرارية أعلى وموصلية حرارية أعلى. تقوم الألواح الباردة المباشرة بالشريحة بتدوير سائل التبريد من خلال حلقات محكمة الغلق متصلة بالمعالجات، مما يؤدي إلى إزالة الحرارة من المصدر. الأساليب الأكثر عدوانية، بما في ذلك الغمر والتبريد بالرش، تضع المكونات في اتصال مباشر مع السوائل العازلة. وقد أدى ذلك إلى إنشاء قائمة جديدة تمامًا من المواد تتكون من ألواح التبريد، والمشعبات، وأنظمة كشف التسرب، ووحدات توزيع التبريد، من بين مكونات أخرى.
ويحتل الموردون العالميون مثل Vertiv مكانة بارزة في هذه المجموعة، لكن الشركات الصينية تتسابق لتوطين قدراتها. أصبحت شركة Envicool، التي تشمل عملائها Nvidia وAlibaba وTencent، واحدة من أبرز اللاعبين المحليين، حيث قام كل من Goldman Sachs وUBS برفع الأسعار المستهدفة لأسهمها، مستشهدين بالطلب المرتبط بالذكاء الاصطناعي وكفاءة الطاقة.
تزايد أحجام النماذج
ومع ذلك، فإن ميل الصين نحو التبريد السائل لا يرجع فقط إلى درجات حرارة الرقائق. تفرض سياساتها الوطنية المتعلقة بالطاقة والحد من الكربون أهدافًا واضحة لفعالية استخدام الطاقة في مراكز البيانات. كفاءة استخدام الطاقة (PUE) هي نسبة إجمالي طاقة المنشأة إلى طاقة معدات تكنولوجيا المعلومات، ويصبح من الصعب تحسينها مع ارتفاع حمل التبريد. يمكن للأنظمة السائلة، من خلال تقليل أحمال المروحة وتمكين درجات حرارة أعلى لسائل التبريد، تحسين الكفاءة الإجمالية بشكل ملموس.
وعلى الرغم من توفير موارد الطاقة المتجددة، تفتقر المقاطعات الغربية للبلاد إلى البنية التحتية القديمة لمراكز البيانات الموجودة في المناطق الساحلية. يسمح بناء مجمعات جديدة للذكاء الاصطناعي للمشغلين بالتصميم حول التبريد السائل منذ البداية، بدلاً من تحديث المرافق المبردة بالهواء. وستعمل حرية التصميم هذه على تقليل الاحتكاك في اعتماد هياكل التبريد المباشر إلى الرقاقة أو الغمر على النطاق الذي تحتاجه الصين.
وفي الوقت نفسه، تتزايد ضغوط الطلب على الشركات الصينية فائقة التوسع. تتزايد أحجام نماذجها، وتمتد عمليات التدريب الخاصة بها عبر آلاف المسرعات، مما يجعل الموثوقية الحرارية متغيرًا خطيرًا في الأداء لأن أي تدرجات في درجة الحرارة عبر الحوامل يمكن أن تؤثر على سرعات الساعة ومعدلات الخطأ.
ساحة معركة جديدة
لقد ركز الحديث حول أجهزة الذكاء الاصطناعي على وحدات معالجة الرسومات والذاكرة لسنوات، والآن ينضم التبريد إلى تلك القائمة. سيحصل البائعون الذين يمكنهم تقديم حلول متكاملة على نطاق الرف والتي تجمع بين المسرعات والشبكات والإدارة الحرارية السائلة على ميزة في سرعة النشر والكفاءة التشغيلية.
أعلنت شركة Vertiv، وهي شركة متخصصة في توفير البنية التحتية لمراكز البيانات ومقرها أوهايو، عن مبيعات صافية بلغت حوالي 13.5 مليار دولار. كما أنها شريك لـ Nvidia، مما يضعها مباشرة في مسار عمليات نشر Blackwell. ومن المفهوم أن النظراء الصينيين يسعون إلى تحالفات مماثلة داخل سلاسل التوريد المحلية، خاصة وأن ضوابط التصدير سوف تستمر في تعقيد الوصول إلى بعض المكونات الأمريكية.
في نهاية المطاف، السؤال ليس ما إذا كان التبريد السائل سيصبح هو الوضع الافتراضي للبنية التحتية للذكاء الاصطناعي، ولكن مدى السرعة. مع تجاوز وحدات معالجة الرسومات من فئة Blackwell 1000 واط ومنصات الحامل التي تعمل على دمج العشرات من هذه المكونات، يبدو تبريد الهواء مقتصرًا بشكل متزايد على أعباء عمل الاستدلال ذات الكثافة المنخفضة. وحتى هناك، يتوقع المحللون أن يرتفع اعتماد السوائل، وإن كان بوتيرة أبطأ مما كانت عليه في مجموعات التدريب.
بالعودة إلى الصين – مجموعات “10000 بطاقة” التي تدفع 1590 إكسافلوب ستعني أنه حتى المكاسب الهامشية في كفاءة التبريد عن طريق التبريد السائل يمكن أن تترجم إلى توفير كبير في الطاقة واستقرار عام أفضل. تحتاج الصين فقط إلى إنشاء سلسلة توريد كاملة لتحقيق ذلك.

التعليقات