تستعد منصة Vera Rubin من Nvidia لتشغيل الجيل القادم من مراكز بيانات الذكاء الاصطناعي، أو “المصانع”، كما يسميها الرئيس التنفيذي Jensen Huang، على نطاق واسع، عندما تبدأ هذه الأنظمة في الوصول في وقت لاحق من هذا العام. اليوم، خلال كلمته الرئيسية في GTC، كشف Huang عن كيفية استخدام Nvidia لعنوان IP الذي حصلت عليه من Groq العام الماضي لتوسيع قدرات Rubin. تشتمل منصة Rubin الآن على شريحة جديدة، Nvidia Groq 3 LPU، وهي عبارة عن مسرع استدلال يعزز قدرة هذه الأنظمة على تقديم الرموز المميزة في الحجم وفي زمن الوصول المنخفض للتفاعل العالي في طليعة نماذج الذكاء الاصطناعي.
تذكر أن منصة Rubin تشتمل بالفعل على ست شرائح تقوم Nvidia ببناء أنظمة على نطاق الرف منها وتوسيع نطاقها في مصانع الذكاء الاصطناعي: وحدة معالجة الرسومات Rubin نفسها، ووحدة المعالجة المركزية Vera، ومفاتيح توسيع نطاق NVLink 6، وبطاقة واجهة الشبكة الذكية ConnectX 9، ووحدة معالجة البيانات Bluefield 4، ومفتاح توسيع نطاق Spectrum-X مع البصريات المعبأة بشكل مشترك. تصبح وحدة Groq 3 LPU لبنة بناء أخرى لروبن على نطاق واسع.
على عكس معظم مسرعات الذكاء الاصطناعي، التي تعتمد على HBM كطبقة للذاكرة العاملة، تشتمل كل وحدة Groq 3 LPU على 500 ميجابايت من ذاكرة SRAM، وهي نفس الذاكرة المستخدمة لذاكرة التخزين المؤقت فائقة السرعة على وحدات المعالجة المركزية ووحدات معالجة الرسومات. يعد هذا أمرًا تافهًا مقارنة بسعة 288 جيجابايت من HBM4 الأكثر اتساعًا على كل وحدة معالجة رسومات Rubin، ولكن كما تتوقع، توفر ذاكرة SRAM عرض نطاق ترددي يبلغ 150 تيرابايت/ثانية، أي أكثر بكثير من 22 تيرابايت/ثانية من نفس HBM. بالنسبة لعمليات فك تشفير الذكاء الاصطناعي الحساسة لعرض النطاق الترددي، فإن التعزيز الهائل لعرض النطاق الترددي لشريحة Groq 3 يوفر فوائد محيرة لتطبيقات الاستدلال.
يستمر المقال أدناه
ألمح باك أيضًا إلى أن Groq 3 LPU قد يؤدي إلى تقليل دور مسرع الاستدلال Rubin CPX، قائلًا إن الشركة تركز حاليًا على دمج حامل Groq 3 LPX مع Rubin. على الرغم من أنه لم يقدم المزيد من التفاصيل، إلا أن هذا التحول في التركيز سيكون منطقيًا في عالم اليوم المقيد بالذاكرة، نظرًا لأن الرقاقتين تهدفان إلى تقديم تحسينات مماثلة لأداء الاستدلال ولا تتطلب وحدة Groq LPU كمية كبيرة من ذاكرة GDDR7 التي تتطلبها كل وحدة Rubin CPX.
نحن موجودون على أرض الواقع في GTC هذا الأسبوع، وسنستكشف ما يعنيه اندماج Groq وNvidia IP لمستقبل استدلال الذكاء الاصطناعي من خلال المحادثات والجلسات في هذا الحدث. ابقوا متابعين.
يتبع أجهزة توم على أخبار جوجل، أو أضفنا كمصدر مفضل، للحصول على آخر الأخبار والتحليلات والمراجعات في خلاصاتك.

التعليقات