التخطي إلى المحتوى

كشفت Nvidia النقاب عن وحدة معالجة اللغة Groq 3 في GTC 2026 في سان خوسيه يوم الاثنين، مما يمثل أول شريحة تخرج من صفقة الترخيص والمواهب بقيمة 20 مليار دولار مع شركة Groq الناشئة للاستدلال بالذكاء الاصطناعي، والتي تم إبرامها عشية عيد الميلاد العام الماضي. يتم إدخال مسرع الاستدلال المستند إلى SRAM في منصة Vera Rubin كمعالج مشترك مخصص لمرحلة فك التشفير، وتخطط Nvidia لشحنه في الربع الثالث من عام 2026، والذي تم تصنيعه بواسطة Samsung باستخدام عملية 4 نانومتر. إنه أول منتج على نطاق واسع للشركة يتم تصنيعه حول السيليكون الذي لا يحتوي على وحدة معالجة الرسومات – وقد أدى وصوله بالفعل إلى إزاحة شريحة Nvidia محلية الصنع من خارطة الطريق.

تحمل شريحة LP30 الموجودة في قلب حامل Groq 3 LPX 512 ميجابايت من ذاكرة SRAM على الشريحة لكل قالب، مما يوفر 150 تيرابايت/ثانية من عرض النطاق الترددي للذاكرة. هذا الرقم يقزم 22 تيرابايت / ثانية المتوفرة من 288 جيجابايت من HBM4 على كل وحدة معالجة رسومات Rubin. يحتوي حامل LPX الكامل على 256 وحدة LPU بإجمالي 128 جيجابايت من ذاكرة SRAM و40 بيتابت/ثانية من إجمالي عرض النطاق الترددي. تدعي Nvidia أن حامل LPX، المقترن بـ Vera Rubin NVL72، يوفر إنتاجية أعلى بمقدار 35 مرة لكل ميجاوات من Blackwell NVL72 وحده لنماذج تريليون معلمة، عند نقطة سعر مستهدفة تبلغ 45 دولارًا لكل مليون رمز.

جروك 3 وفيرا روبين

تقديم رفوف روبن

قامت Nvidia بتفصيل إستراتيجيتها الكاملة المكونة من سبع شرائح Rubin SuperPOD في GTC 2026. (حقوق الصورة: نفيديا)

تتعامل وحدات معالجة الرسوميات Rubin مع مرحلة التعبئة المسبقة كثيفة الحوسبة للاستعلام، ومعالجة سياقات الإدخال الطويلة، بينما تتولى وحدات معالجة الرسومات Groq مرحلة فك التشفير، مما يؤدي إلى إنشاء رموز الإخراج في زمن استجابة منخفض. تدير منصة التوزيع Dynamo من Nvidia الانقسام عبر الأجهزة غير المتجانسة، وتوزع أحمال العمل بناءً على حجم الدفعة ومتطلبات التوازي.

يستمر المقال أدناه

Fonte

التعليقات

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *