تنضم رفوف Nvidia Groq 3 LPU وGroq LPX إلى منصة Rubin في GTC - يعمل المسرع المليء بـ SRAM على تعزيز "كل طبقة من نموذج الذكاء الاصطناعي على كل رمز مميز"

تستعد منصة Vera Rubin من Nvidia لتشغيل الجيل القادم من مراكز بيانات الذكاء الاصطناعي، أو “المصانع”، كما يسميها الرئيس التنفيذي Jensen Huang، على نطاق واسع، عندما تبدأ هذه الأنظمة في الوصول في وقت لاحق من هذا العام. اليوم، خلال كلمته الرئيسية في GTC، كشف Huang عن كيفية استخدام Nvidia لعنوان IP الذي حصلت عليه من Groq العام الماضي لتوسيع قدرات Rubin. تشتمل منصة Rubin الآن على شريحة جديدة، Nvidia Groq 3 LPU، وهي عبارة عن مسرع استدلال يعزز قدرة هذه الأنظمة على تقديم الرموز المميزة في الحجم وفي زمن الوصول المنخفض للتفاعل العالي في طليعة نماذج الذكاء الاصطناعي.

تذكر أن منصة Rubin تشتمل بالفعل على ست شرائح تقوم Nvidia ببناء أنظمة على نطاق الرف منها وتوسيع نطاقها في مصانع الذكاء الاصطناعي: وحدة معالجة الرسومات Rubin نفسها، ووحدة المعالجة المركزية Vera، ومفاتيح توسيع نطاق NVLink 6، وبطاقة واجهة الشبكة الذكية ConnectX 9، ووحدة معالجة البيانات Bluefield 4، ومفتاح توسيع نطاق Spectrum-X مع البصريات المعبأة بشكل مشترك. تصبح وحدة Groq 3 LPU لبنة بناء أخرى لروبن على نطاق واسع.

على عكس معظم مسرعات الذكاء الاصطناعي، التي تعتمد على HBM كطبقة للذاكرة العاملة، تشتمل كل وحدة Groq 3 LPU على 500 ميجابايت من ذاكرة SRAM، وهي نفس الذاكرة المستخدمة لذاكرة التخزين المؤقت فائقة السرعة على وحدات المعالجة المركزية ووحدات معالجة الرسومات. يعد هذا أمرًا تافهًا مقارنة بسعة 288 جيجابايت من HBM4 الأكثر اتساعًا على كل وحدة معالجة رسومات Rubin، ولكن كما تتوقع، توفر ذاكرة SRAM عرض نطاق ترددي يبلغ 150 تيرابايت/ثانية، أي أكثر بكثير من 22 تيرابايت/ثانية من نفس HBM. بالنسبة لعمليات فك تشفير الذكاء الاصطناعي الحساسة لعرض النطاق الترددي، فإن التعزيز الهائل لعرض النطاق الترددي لشريحة Groq 3 يوفر فوائد محيرة لتطبيقات الاستدلال.

يستمر المقال أدناه

وفي المقابل، ستقوم Nvidia ببناء رفوف Groq 3 LPX التي تضم 256 وحدة Groq 3 LPU. يوفر هذا الحامل 128 جيجابايت من ذاكرة الوصول العشوائي SRAM مع 40 بيتابت/ثانية من عرض النطاق الترددي لتسريع الاستدلال، وهو يجمع هذه الرقائق معًا مع واجهة مخصصة قابلة للتوسيع تبلغ 640 تيرابايت/ثانية لكل حامل.

تتصور Nvidia أن Groq LPX هو معالج مساعد لـ Rubin والذي سيعزز أداء فك التشفير في “كل طبقة من نموذج الذكاء الاصطناعي على كل رمز مميز”، وفقًا لنائب رئيس Nvidia الفائق Ian Buck، ويضع Rubin لخدمة الحدود التالية للذكاء الاصطناعي: أنظمة متعددة الوكلاء تحتاج إلى تقديم أداء تفاعلي مع استنتاج نماذج من تريليونات من المعلمات مع نوافذ سياقية لملايين الرموز المميزة.

عندما يبدأ وكلاء الذكاء الاصطناعي في تلك الأنظمة متعددة الوكلاء في التحدث أكثر فأكثر مع أنظمة الذكاء الاصطناعي الأخرى بدلاً من البشر الذين ينظرون إلى نوافذ روبوتات الدردشة، تتغير أيضًا حدود متطلبات الاستجابة. ما قد يبدو وكأنه معدل معقول من الرموز المميزة التي يتم إنشاؤها في الثانية للإنسان هو أمر جليدي بالنسبة لعامل الذكاء الاصطناعي. في مستقبل الأنظمة متعددة الوكلاء التي يصفها باك، فإن الجمع بين وحدات معالجة الرسوميات Rubin وGroq LPUs ينقلنا من عالم حيث يعد 100 رمز مميز في الثانية إنتاجية معقولة إلى واحد من 1500 TPS أو أكثر للاتصال البيني لوكيل الذكاء الاصطناعي.

يمكن أن تساعد إضافة Groq 3 LPU إلى ترسانة Rubin المنصة على صد المنافسين في حدود الاستدلال ذات زمن الوصول المنخفض. Cerebras، التي تدمج محركاتها على نطاق الرقاقة كميات هائلة من SRAM وتحسب لاستدلال زمن الوصول المنخفض مع النماذج المتقدمة، كثيرًا ما أزعجت Nvidia فيما يتعلق بالعيوب المتصورة لوحدات معالجة الرسومات الخاصة بها لهذا الغرض، وقد قام عملاء كبيرون مثل OpenAI بالتسجيل للحصول على قدرة Cerebras لخدمة بعض نماذجها الحديثة مع خصائص الكمون المفضلة لتلك المنصة.

ألمح باك أيضًا إلى أن Groq 3 LPU قد يؤدي إلى تقليل دور مسرع الاستدلال Rubin CPX، قائلًا إن الشركة تركز حاليًا على دمج حامل Groq 3 LPX مع Rubin. على الرغم من أنه لم يقدم المزيد من التفاصيل، إلا أن هذا التحول في التركيز سيكون منطقيًا في عالم اليوم المقيد بالذاكرة، نظرًا لأن الرقاقتين تهدفان إلى تقديم تحسينات مماثلة لأداء الاستدلال ولا تتطلب وحدة Groq LPU كمية كبيرة من ذاكرة GDDR7 التي تتطلبها كل وحدة Rubin CPX.

نحن موجودون على أرض الواقع في GTC هذا الأسبوع، وسنستكشف ما يعنيه اندماج Groq وNvidia IP لمستقبل استدلال الذكاء الاصطناعي من خلال المحادثات والجلسات في هذا الحدث. ابقوا متابعين.

مصدر جوجل المفضل

يتبع أجهزة توم على أخبار جوجل، أو أضفنا كمصدر مفضل، للحصول على آخر الأخبار والتحليلات والمراجعات في خلاصاتك.

Fonte

تنضم رفوف Nvidia Groq 3 LPU وGroq LPX إلى منصة Rubin في GTC – يعمل المسرع المليء بـ SRAM على تعزيز “كل طبقة من نموذج الذكاء الاصطناعي على كل رمز مميز”

تغلب DJ Wonnum على مشاكل طبية حادة قبل الانضمام إلى Detroit Lions

لم يلحظ علماء الفلك حدوث انفجار فضائي بقوة مليار شمس، حتى رصدوا صدى ذلك الانفجار

كيفية مشاهدة JioHotstar خارج الهند – البث عبر الإنترنت ومن أي مكان باستخدام VPN

وفر 130 دولارًا على هذا الكمبيوتر المحمول Asus ROG Strix G16 المخصص للألعاب – ألعاب RTX 5060 مع إمكانية الترقية السهلة بأقل من 1300 دولار

واتهم أوربان المجري بعدم الولاء والابتزاز بسبب حق النقض على قرض أوكرانيا

فشل Crimson Desert في التشغيل لمستخدمي Intel Arc GPU – وتقترح الأسئلة الشائعة للمطور الرجوع إلى سياسة استرداد الأموال

التعليقات

اترك تعليقاً إلغاء الرد

تغلب DJ Wonnum على مشاكل طبية حادة قبل الانضمام إلى Detroit Lions

لم يلحظ علماء الفلك حدوث انفجار فضائي بقوة مليار شمس، حتى رصدوا صدى ذلك الانفجار

كيفية مشاهدة JioHotstar خارج الهند – البث عبر الإنترنت ومن أي مكان باستخدام VPN

وفر 130 دولارًا على هذا الكمبيوتر المحمول Asus ROG Strix G16 المخصص للألعاب – ألعاب RTX 5060 مع إمكانية الترقية السهلة بأقل من 1300 دولار

واتهم أوربان المجري بعدم الولاء والابتزاز بسبب حق النقض على قرض أوكرانيا

فشل Crimson Desert في التشغيل لمستخدمي Intel Arc GPU – وتقترح الأسئلة الشائعة للمطور الرجوع إلى سياسة استرداد الأموال

يرفض هاو الحديث عن انتقال برونو جيماريش باعتباره “مضيعة للطاقة” وسط روابط مانشستر يونايتد وريال مدريد

هذه هي الطريقة التي أكتب بها للتأكد من أن لا أحد يعتقد أنني ذكاء اصطناعي

روس أتكينز تتحدث عن… رسائل ترامب المختلطة بشأن الحرب

ماذا قال مدرب فاندربيلت مارك بينجتون عن نبراسكا وجماهيرها؟