
لعقود من الزمن، عملت صناعة مراكز البيانات على نموذج يمكن التنبؤ به نسبيًا للديناميكا الحرارية. قام المشغلون ببناء قاعة، وملأوها بالخوادم، وقاموا بتدوير الهواء البارد عبر الأرضية أو الممرات.
ظل الحمل الحراري مستقرًا في الغالب، وزادت الأحمال الكهربائية تدريجيًا، ويمكن تحديد حجم أنظمة التبريد بهوامش ثابتة ومحافظة.
يستمر المقال أدناه
مدير المنتج، أنظمة المياه المبردة العالمية، Vertiv.
لقد أدى الاعتماد السريع للذكاء الاصطناعي التوليدي ونماذج اللغات الكبيرة (LLMs) إلى ظهور واقع حراري جديد. على عكس بعض المهام، يواجه تدريب نموذج الذكاء الاصطناعي تقلبات كبيرة في عبء العمل الحسابي بدلاً من الناتج الثابت.
يمكن أن يزداد سحب الطاقة ديناميكيًا خلال ثوانٍ، غالبًا عبر مجموعات الأجهزة المختلطة ذات الخصائص الحرارية المختلفة جدًا.
يؤدي هذا إلى إنشاء نقاط ساخنة محلية يصعب على تبريد الهواء التقليدي التخفيف منها بالسرعة الكافية.
وبدون استجابة تبريد منسقة، قد يؤثر هذا التباين الحراري على أداء وعمر الأجهزة ذاتها التي من المفترض حمايتها.
التحول من الساكن إلى الديناميكي
ويكمن التحدي في كيف أصبح السلوك الحراري ديناميكيًا وغير متساوٍ ومقترنًا بإحكام بأنماط عبء العمل. في الماضي، كان التبريد عبارة عن طبقة ثابتة أسفل مجموعة تكنولوجيا المعلومات. واليوم، يجب أن تكون القدرة على التكيف تتطور جنبًا إلى جنب مع عبء العمل.
إن القرارات المتعلقة بتوصيل الطاقة، وكثافة الحامل، ووضع أحمال العمل لها الآن عواقب حرارية فورية. وهذا يتطلب محاذاة أوثق بين معدات تكنولوجيا المعلومات والبنية التحتية للتبريد.
لم يعد من الممكن التعامل مع الحرارة باعتبارها مشكلة في اتجاه المصب يجب إدارتها عند فتحة العادم؛ ويجب إدارتها كجزء من نظام متصل يمتد عبر المنشأة بأكملها.
التقاط الحرارة من المصدر
للتعامل مع الكثافة القصوى لوحدات معالجة الرسومات الحديثة (GPUs)، يقوم المشغلون بالتقاط الطاقة الحرارية بالقرب من المصدر.
يحبس التبريد السائل المباشر للرقاقة الحرارة عند مستوى السيليكون، مما يقلل الحاجة إلى مراوح عالية السرعة والطاقة المطلوبة ذات الصلة. تقوم المبادلات الحرارية بالباب الخلفي باعتراض الحرارة قبل أن تغمر الممر.
توفر هذه الطريقة الدقة لأن السائل يمتص الحرارة بشكل أكثر فعالية من الهواء، مما يسمح للمشغلين بإدارة أوقات الذروة لأعباء عمل الذكاء الاصطناعي دون الإفراط في توفير المنشأة بأكملها.
لتمكين بنية التبريد السائل هذه، تلعب وحدات توزيع سائل التبريد (CDUs) دورًا مهمًا. تشمل عروض CDU نطاقًا واسعًا من السعات وتتضمن تكوينات داخل الحامل وفي الصف والتي يمكن وضعها بجوار بعضها البعض.
تدعم هذه الأنظمة تصميمات التبادل الحراري من سائل إلى هواء ومن سائل إلى سائل، مما يجعلها متعددة الاستخدامات ومناسبة لتخطيطات مراكز البيانات المتنوعة، بما في ذلك المرافق الحالية والمباني الجديدة.
تصميم للكثافة المختلطة
من غير المرجح أن يختفي تبريد الهواء بين عشية وضحاها أو في أي وقت قريب. من المحتمل أن يتكون المستقبل القريب من حلول هجينة حيث توجد الرفوف القياسية جنبًا إلى جنب مع مجموعات الذكاء الاصطناعي عالية الكثافة.
وهذا يتطلب نهجا معماريا متعدد الطبقات. تُستخدم وحدات معالجة الهواء القائمة على المحيط وتقنيات الجدار الحراري لتحديد مسارات تدفق الهواء عند حدود قاعة البيانات.
في مراكز البيانات، تعتمد الإدارة الحرارية على مستوى الغرفة على حلول تبريد الهواء الميكانيكية القائمة، بما في ذلك وحدات تكييف هواء غرفة الكمبيوتر (CRAC) التي تستخدم التبريد بالتمدد المباشر ووحدات معالجة هواء غرفة الكمبيوتر (CRAH) التي تستخدم الماء المبرد من المحطات المركزية.
تظل هذه الأنظمة التقليدية مناسبة تمامًا لتمكين التطور التدريجي نحو تصميمات التبريد الهجين، حيث يعمل دوران الهواء جنبًا إلى جنب مع التبريد السائل المستهدف لمعالجة الأحمال الحرارية المتنوعة بفعالية.
أدت التطورات في بنيات الخادم ووحدة معالجة الرسومات، جنبًا إلى جنب مع معايير الصناعة المتطورة، إلى زيادة درجات حرارة الهواء الداخل المقبولة لمعدات تكنولوجيا المعلومات – مما يسمح غالبًا بالتشغيل حتى عتبات أعلى ضمن النطاقات المسموح بها، على سبيل المثال، ما يصل إلى 40-45 درجة مئوية لفئات معينة.
يسمح هذا التطور للأنظمة المبردة بالسوائل بالعمل بكفاءة مع ارتفاع درجات حرارة مياه إمداد المنشأة، والتي تصل عادةً إلى 40 درجة مئوية أو أكثر.
ونتيجة لذلك، يكتسب التبريد المعتمد على الهواء طابعًا عمليًا متجددًا وفعالية من حيث التكلفة في التكوينات الهجينة، بينما يؤدي في الوقت نفسه إلى إجراء مراجعة شاملة لأنظمة المياه المبردة القديمة وإعدادات التوسع المباشر لتحديد النهج الأكثر ملاءمة والأمثل لتبريد الهواء.
تتيح هذه الأنظمة جمع الحرارة بشكل يتم التحكم فيه عبر مرافق الأرضيات المرتفعة وغير المرتفعة. في قاعات الذكاء الاصطناعي مختلطة الكثافة، تساعد هذه العناصر المعمارية في الحفاظ على ظروف يمكن التنبؤ بها حتى مع وضع استراتيجيات التبريد المحلية القائمة على السائل.
والنتيجة هي قدر أكبر من الاستقرار والاختيار. يمكن للمشغلين زيادة الكثافة بشكل انتقائي بدلاً من الالتزام بإعادة تصميم المنشأة بالجملة.
إعادة النظر في رفض الحرارة المهدرة
وبمجرد التقاط الحرارة، تتطور أيضًا استراتيجيات رفضها أو إعادة استخدامها. نظرًا لأن المتطلبات الحرارية الدقيقة لأجهزة الذكاء الاصطناعي الناشئة مستمرة في التطور، وتستمر الأحمال الحرارية على مستوى الحامل في الارتفاع، فإن التحديد الصارم لنقطة ضبط واحدة للمياه المبردة قد يؤدي إلى ظهور بعض القيود.
يمكن أن يؤدي ذلك إلى كفاءة دون المستوى الأمثل، أو عدم كفاية القدرة على رفض الحرارة أثناء الأحمال القصوى، أو إهدار الطاقة غير الضروري إذا كانت الأنظمة المستقبلية تتحمل ظروفًا أكثر دفئًا. وبدلاً من ذلك، يتم تفضيل البنى المرنة التي تستوعب نطاقًا أوسع من درجات حرارة العرض واستراتيجيات التبريد الهجين بشكل متزايد للتخفيف من هذه المتغيرات مع دعم العمليات القابلة للتطوير وعالية الكثافة.
يظهر تقليم التبريد للإجابة على هذه الظروف الديناميكية كحل رئيسي لمراكز البيانات المصممة للعمل في درجات حرارة مرتفعة للمياه. وهذا يسمح بالاستخدام الموسع للتبريد الحر ويقلل الاعتماد على الضواغط الميكانيكية، مما يجعل نظام التبريد متوافقًا مع ظروف التشغيل في العالم الحقيقي بدلاً من نقاط التصميم الثابتة.
تمثل المبردات اللولبية ذات التبريد الحر خيارًا استراتيجيًا لمراكز البيانات التي تسعى إلى تقليل استهلاك الطاقة دون المساس بالأداء. إنها توفر كفاءة عالية في درجات الحرارة المحيطة المرتفعة، مما يسمح للمشغلين بتمديد ساعات التبريد المجانية على مدار العام.
من خلال الجمع بين التبريد الميكانيكي القوي وتصميم التبريد الحر الأمثل، تساعد هذه الوحدات على خفض تكاليف التشغيل، وتحقيق الاستقرار في أداء النظام، ودعم الاستراتيجيات الحرارية الأكثر مسؤولية من الناحية البيئية.
وفي الوقت نفسه، تستمر تقنيات التبريد بالطرد المركزي في توفير القدرة الأساسية. عندما يكون أداء التبريد الموثوق به مطلوبًا أو حيث تظل درجات حرارة الإمداد المنخفضة ضرورية، توفر أنظمة الطرد المركزي الاستقرار وقابلية التوسع اللازمة للتعامل مع الأحمال المتغيرة.
وبدلاً من تمثيل الفلسفات المتنافسة، تعكس هذه الأساليب مراحل مختلفة من الرحلة الحرارية للمنشأة وأولويات تشغيلية مختلفة.
التحكم كطبقة موحدة
ويكمن التحدي في إدارة أنظمة الهواء والسائل والهجين في وقت واحد. ما يمكّن هذا التنوع في استراتيجيات التبريد من العمل كنظام متماسك هو التحكم.
تعمل أجهزة الاستشعار والتحليلات الحديثة الآن على ربط حمل تكنولوجيا المعلومات مباشرةً بمحطة التبريد وأنظمة إدارة تدفق الهواء. عندما يتزايد عبء عمل الذكاء الاصطناعي، تتوقع منصة التحكم تغير الحرارة وتضبط نقاط الضبط ومعدلات التدفق وقدرة التبريد في الوقت الفعلي.
وهذا يقلل من الاستخدام غير الضروري للطاقة، ويحسن المرونة، ويوفر الرؤية التشغيلية اللازمة للتخطيط للتوسع المستقبلي.
بالنسبة للمشغلين، تدعم هذه الرؤية اتخاذ قرارات أفضل. إن فهم كيفية انتقال الحرارة فعليًا عبر المنشأة يجعل من السهل تقييم التقنيات الجديدة والتحقق من صحة افتراضات التصميم وإدارة المخاطر مع توسيع نطاق نشر الذكاء الاصطناعي.
يساعد إشراك خدمة الدعم الشاملة عبر السلسلة الحرارية بأكملها – بدءًا من التصميم الأولي والتشغيل وحتى التحسين المستمر – على تحسين الموثوقية المستمرة من خلال نشر الخبراء والصيانة التنبؤية.
نحن ندرج أفضل نماذج اللغات الكبيرة (LLMs).

التعليقات