كان هناك العديد من حالات تفجير موصل الطاقة ذات 16 سنًا التي سجلها العملاء على مدار السنوات القليلة الماضية على كل من بطاقات الألعاب الاستهلاكية وبطاقات المستهلك – والآن أصبحت ملحمة الموصل سيئة التصميم هذه أيضًا (نوعًا ما) تضرب وحدات معالجة الرسومات في مراكز البيانات. قام فني الإصلاح المقيم northwestrepair مؤخرًا بنشر مقطع فيديو على موقع YouTube وهو يقوم بإصلاح وحدة معالجة الرسوميات لمركز بيانات H200 Hopper التي تبلغ قيمتها 30 ألف دولار مع موصل 12VHPWR معطل.
على عكس معظم قصص الكوارث ذات 16 سنًا، كان الضرر الذي لحق بالموصل الموجود على وحدة معالجة الرسومات H200 نتيجة لخطأ المستخدم، وليس بسبب التصميم الخاطئ. اكتشفت شركة Northwestrepair أن معظم المسامير كانت منحنية ومتضررة، مما يشير إلى أن الشخص الذي يتعامل مع وحدة معالجة الرسومات من المحتمل أن يكون قد حطم كابل الطاقة في موصل الطاقة بقوة شديدة.
شاهد
لحسن الحظ، تمكن فني الإصلاح من حل المشكلة: فقد أخذوا موصل طاقة احتياطيًا مكونًا من 16 سنًا وقاموا بتبديل دبابيس الاستشعار الأربعة في الموصل الاحتياطي مع المسامير المكسورة في موصل H200 المكون من 16 سنًا. استغرق هذا بعض العمل – كان على شركة northwestrepair قطع وتقليم المسامير الجديدة بنفس شكل المسامير القديمة ثم لحام المسامير بموصل الطاقة الخاص بـ H200.
لم يتم الإصلاح بدون بعض العوائق: في منتصف عملية الإصلاح، قامت شركة northwestrepair بطريق الخطأ بلحام دبابيس الاستشعار بترتيب خاطئ. لإصلاح ذلك، قاموا بتبديل كابلات الاستشعار الموجودة على القابس – حيث قاموا بتوصيل دبابيس الاستشعار بلوحة PCB لتتناسب مع دبابيس الاستشعار المنحرفة (الآن).
على الرغم من ذلك، فشلت البطاقة في التشغيل بسبب وجود قصر في مكان ما على PCB نفسه فيما يتعلق بدبابيس الاستشعار. لذلك بدلاً من الإصلاح الذي – التي، اختارت شركة northwestrepair تجاوز المنافذ تمامًا عن طريق فصل المقاوم الذي يربط منافذ الاستشعار بالبطاقة. تم استعادة الطاقة إلى البطاقة، ثم تم إرجاع البطاقة إلى العميل دون مزيد من الاختبارات (لا يدعم H200 اللوحات الأم لسطح المكتب الاستهلاكي) – على الرغم من أن شركة Northwestrepair لاحظت في التعليقات أن العميل أكد أن وحدة معالجة الرسومات تعمل ولكنه لم يدفع له مقابل جهوده.
يعد H200 وحدة معالجة رسومات أقدم في هذه المرحلة، استنادًا إلى بنية Hopper. قدمت NVIDIA متغيرات متعددة، ولكن الإصدار الذي تم إصلاحه في هذه المقالة هو إصدار PCIe الذي يضم 16896 نواة CUDA و132 SMs و50 ميجابايت من ذاكرة التخزين المؤقت L2 و600 واط TDP و141 جيجابايت من ذاكرة HBM3e وواجهة PCIe 5.0 x16. بغض النظر عن عمرها، فإن وحدة معالجة الرسوميات Nvidia H200 تُباع بسعر 30 ألف دولار تقريبًا.
يتبع أجهزة توم على أخبار جوجل، أو أضفنا كمصدر مفضل، للحصول على آخر الأخبار والتحليلات والمراجعات في خلاصاتك.

التعليقات