
- يصل تصميم HBM-on-GPU ثلاثي الأبعاد إلى كثافة حوسبة قياسية لأحمال عمل الذكاء الاصطناعي المطلوبة
- تجاوزت درجات حرارة الذروة لوحدة معالجة الرسومات 140 درجة مئوية بدون استراتيجيات التخفيف الحراري
- أدى خفض معدل ساعة وحدة معالجة الرسومات إلى النصف إلى خفض درجات الحرارة ولكنه أدى إلى إبطاء تدريب الذكاء الاصطناعي بنسبة 28%
قدمت شركة Imec اختبارًا لتصميم HBM-on-GPU ثلاثي الأبعاد يهدف إلى زيادة كثافة الحوسبة لأحمال عمل الذكاء الاصطناعي المطلوبة في اجتماع IEEE الدولي للأجهزة الإلكترونية (IEDM) لعام 2025.
يضع نهج التحسين المشترك لتكنولوجيا النظام الحراري أربع مجموعات من الذاكرة ذات النطاق الترددي العالي مباشرة فوق وحدة معالجة الرسومات من خلال اتصالات microbump.
تتكون كل حزمة من اثني عشر قالب DRAM هجينًا، ويتم تطبيق التبريد أعلى وحدات HBM.
محاولات التخفيف الحراري ومقايضات الأداء
يطبق الحل خرائط الطاقة المستمدة من أعباء العمل ذات الصلة بالصناعة لاختبار كيفية استجابة التكوين في ظل ظروف تدريب واقعية للذكاء الاصطناعي.
يعد هذا الترتيب ثلاثي الأبعاد بقفزة في كثافة الحساب والذاكرة لكل وحدة معالجة رسومات.
كما أنها توفر نطاقًا تردديًا أعلى لذاكرة وحدة معالجة الرسومات (GPU) مقارنةً بالتكامل 2.5D، حيث توجد مكدسات HBM حول وحدة معالجة الرسومات (GPU) على وسيط من السيليكون.
ومع ذلك، تكشف عمليات المحاكاة الحرارية عن تحديات خطيرة أمام التصميم ثلاثي الأبعاد لـ HBM-on-GPU.
بدون تخفيف، وصلت درجات الحرارة القصوى لوحدة معالجة الرسومات إلى 141.7 درجة مئوية، وهو أعلى بكثير من الحدود التشغيلية، في حين بلغ خط الأساس 2.5D ذروته عند 69.1 درجة مئوية في ظل نفس ظروف التبريد.
استكشفت شركة Imec الاستراتيجيات على مستوى التكنولوجيا مثل دمج مكدسات HBM وتحسين السيليكون الحراري.
تضمنت الاستراتيجيات على مستوى النظام التبريد على الوجهين وقياس تردد وحدة معالجة الرسومات.
أدى تقليل معدل ساعة وحدة معالجة الرسومات بنسبة 50% إلى خفض درجات الحرارة القصوى إلى أقل من 100 درجة مئوية، لكن هذا التغيير أدى إلى إبطاء أعباء عمل تدريب الذكاء الاصطناعي.
على الرغم من هذه القيود، تقول شركة Imec أن البنية ثلاثية الأبعاد يمكن أن توفر كثافة حسابية وأداء أعلى من التصميم المرجعي 2.5D.
قال جيمس مايرز، مدير برنامج تكنولوجيا النظام في Imec: “إن خفض التردد الأساسي لوحدة معالجة الرسومات إلى النصف أدى إلى رفع درجة الحرارة القصوى من 120 درجة مئوية إلى أقل من 100 درجة مئوية، مما يحقق هدفًا رئيسيًا لتشغيل الذاكرة. على الرغم من أن هذه الخطوة تأتي مع عقوبة عبء العمل بنسبة 28%…”
“…تتفوق الحزمة الإجمالية على خط الأساس 2.5D بفضل كثافة الإنتاجية الأعلى التي يوفرها التكوين ثلاثي الأبعاد. نحن نستخدم حاليًا هذا الأسلوب لدراسة تكوينات GPU وHBM الأخرى…”
تقترح المنظمة أن هذا النهج يمكن أن يدعم الأجهزة المرنة حرارياً لأدوات الذكاء الاصطناعي في مراكز البيانات الكثيفة.
تقدم شركة Imec هذا العمل كجزء من جهد أوسع لربط القرارات التقنية بسلوك النظام.
يتضمن ذلك برنامج التحسين المشترك عبر التكنولوجيا (XTCO)، الذي تم إطلاقه في عام 2025، والذي يجمع بين عقليتي STCO وDTCO لمواءمة خرائط طريق التكنولوجيا مع تحديات توسيع نطاق النظام.
قالت Imec أن XTCO تتيح حل المشكلات بشكل تعاوني للاختناقات الحرجة عبر النظام البيئي لأشباه الموصلات، بما في ذلك شركات الأنظمة والأنظمة.
ومع ذلك، من المرجح أن تظل هذه التقنيات محصورة في المرافق المتخصصة التي تتمتع بميزانيات الطاقة والحرارة الخاضعة للرقابة.
عبر TechPowerUp
اتبع TechRadar على أخبار جوجل و أضفنا كمصدر مفضل للحصول على أخبار الخبراء والمراجعات والآراء في خلاصاتك. تأكد من النقر على زر المتابعة!
وبالطبع يمكنك أيضًا اتبع TechRadar على TikTok للحصول على الأخبار والمراجعات وفتح الصناديق في شكل فيديو، والحصول على تحديثات منتظمة منا على واتساب أيضاً.

التعليقات