قدمت Amazon Web Services هذا الشهر معالج Graviton5، وهو معالج خادم مخصص للأغراض العامة من الجيل الخامس، مصمم للتنافس مع وحدات المعالجة المركزية المتوافقة مع معايير الصناعة من AMD وIntel في مراكز بيانات AWS. يعمل المعالج الجديد على توسيع برنامج وحدة المعالجة المركزية المستندة إلى Arm داخل الشركة من AWS مع وحدة معالجة مركزية تحزم ما يصل إلى 192 مركزًا و180 ميجابايت من ذاكرة التخزين المؤقت L3، وهي مصممة للتنافس مع معالجات AMD EPYC وIntel Xeon المتطورة، ومن المحتمل أن تحل محل بعضها في مراكز بيانات AWS.
في لمحة
يتوفر المعالج الجديد الآن في مثيلات Amazon EC2 M9g قيد المعاينة، بينما من المقرر إطلاق متغيرات C9g المحسنة للحوسبة وR9g التي تركز على الذاكرة في عام 2026. تعد مثيلات EC2 M9g الحالية أسرع بما يصل إلى 30% لقواعد البيانات، وأسرع بما يصل إلى 35% لتطبيقات الويب، وأسرع بما يصل إلى 35% لأحمال عمل التعلم الآلي مقارنة بـ M8g، وفقًا لـ AWS.
الغوص بشكل أعمق: 192 نواة Neoverse V3
إن Amazon Web Services غامضة عمدًا بشأن المواصفات الدقيقة والتصميم الداخلي لوحدة المعالجة المركزية Graviton5 الخاصة بها. ومع ذلك، فهي تقدم مقارنات مع شريحة Graviton4 من الجيل السابق، والتي تتيح لنا فك تشفير بعض التفاصيل والتعمق فيها بمزيد من العمق.
تؤكد AWS وArm رسميًا أن Graviton5 يدمج 192 نواة Neoverse V3 لكل حزمة، تم تصنيعها باستخدام عملية من فئة 3 نانومتر، مما يجعلها وحدة المعالجة المركزية الأكثر كثافة في تشكيلة Graviton ومعالج Armv9.2 الأكثر كثافة المتاح حتى الآن. تمت إعادة تصميم التصميم الداخلي للمعالج لتقليل عبء الاتصالات، وتطالب AWS بخفض زمن الوصول بين النواة بنسبة تصل إلى 33%، وهو أمر جدير بالملاحظة بشكل خاص نظرًا للزيادة المضاعفة في عدد النواة.
عندما نناقش Neoverse V3، لا يسعنا إلا أن نفكر في أنظمة الحوسبة الفرعية (CSS) التي طورتها شركة Arm. في حين أكدت شركة Arm أننا نتعامل مع Neoverse V3، لم تؤكد شركة Amazon ولا شركة Arm أن Graviton5 يستخدم CSS المطور من شركة Arm. وهذا يعني أننا على الأرجح نتعامل مع تصميم فريد في Graviton 5.
في مقارنات الأداء بين نواة Neoverse V3 وسابقتها، تدعي Arm زيادة بنسبة 9% – 16% مقارنة بـ Neoverse V2 عبر أعباء العمل السحابية العامة وما يصل إلى 84% في تحليلات بيانات الذكاء الاصطناعي. وهذا هو أحد الأسباب التي تجعل AWS متحفظًا جدًا بشأن تحسينات الأداء، سواء بالنسبة لـ Graviton5 أو مثيلات M9g ذات الحوسبة المكثفة بشكل عام. سبب آخر لتقدير أداء AWS المتحفظ هو أنها لا تبيع أداءً متطورًا مثل AMD أو Nvidia، بل تبيع أداءً يمكن التنبؤ به لكل دولار وقابلية للتوسع في السحابة. ومع ذلك، مع معالج 192 نواة، تضع AWS نفسها في أعلى الدوري بين مطوري وحدة المعالجة المركزية.
تحل ذاكرة التخزين المؤقت L3 محل ذاكرة التخزين المؤقت على مستوى النظام
أحد الأشياء المثيرة للاهتمام التي يجب ملاحظتها حول Graviton5 هو أنه يأتي مع ذاكرة تخزين مؤقت L3، وليس ذاكرة تخزين مؤقت على مستوى النظام مثل Graviton4. في حين أن L3 وSLC في وحدات المعالجة المركزية لمراكز البيانات لديهما الكثير من القواسم المشتركة، إلا أنهما ليسا نفس الشيء. تقليديًا، تعد ذاكرة التخزين المؤقت L3 عبارة عن ذاكرة تخزين مؤقت من المستوى الأخير موجودة داخل كل لوحة حسابية أو مجموعة أساسية في وحدة المعالجة المركزية لمركز البيانات. يخدم L3 في المقام الأول أحمال عمل وحدة المعالجة المركزية (CPU) عن طريق تقليل الوصول إلى DRAM؛ تم تحسينه لزمن الوصول المنخفض ويشارك بشكل مباشر في بروتوكول التماسك الأساسي. لذلك، يرتبط L3 ارتباطًا وثيقًا بالنوى ويكون قريبًا منها فعليًا.
على النقيض من ذلك، يقع SLC خارج المجموعات الأساسية في نسيج SoC ويتم مشاركته بواسطة جميع مراكز وحدة المعالجة المركزية ومختلف المسرعات الأخرى وأجهزة الإدخال/الإخراج وبطاقات NIC ومحركات DMA. تميل إلى أن تكون أكبر بكثير (غالبًا 100-300+ ميجابايت) ومُحسَّنة للإنتاجية بدلاً من زمن الوصول، لأنها تعمل كمخزن مؤقت عالمي يقلل الضغط على DRAM ويوفر وصولاً متماسكًا إلى كتل الحوسبة غير المتجانسة. يمكن لـ SLC تحسين القياس للأعداد الأساسية العالية جدًا وتمكين دلالات الذاكرة الموحدة عبر وحدات المعالجة المركزية ووحدات معالجة الرسومات والمسرعات الموجودة على القالب، وهو دور لا تستطيع ذاكرات التخزين المؤقت L3 التقليدية تحقيقه بمفردها.
لم تشرح أمازون قرار التصميم علنًا، ولكن استنادًا إلى بنية Graviton4 وما نعرفه عن Graviton5، فمن المؤكد تقريبًا أن السبب هو قابلية التوسع المعماري. إن الانتقال من SLC في Graviton4 إلى 180 ميجا بايت L3 كبيرة في Graviton5 ليس تجميليًا؛ إنه يعكس التغييرات الأساسية في كيفية قيام المعالج المكون من 192 نواة بنقل البيانات وإدارة زمن الوصول والحفاظ على التماسك.
تعمل بنية Graviton4 – 96 نواة Neoverse V2، وشبكة CMN-700، و12 قناة DDR5-5600 – بكفاءة مع SLC مركزية أو شبه مركزية. لكن مضاعفة العدد الأساسي إلى 192 يزيد بشكل كبير من حركة مرور الشبكة، ومسافات القفزات، والتنافس على أي بنية ذاكرة تخزين مؤقت موحدة. على هذا النطاق، من شبه المؤكد أن SLC المتجانسة يمكن أن تصبح عنق الزجاجة في زمن الاستجابة ولن تدعم مطالبة AWS بزمن وصول أقل للاتصالات بين النواة بنسبة تصل إلى 33٪. تسمح شريحة L3 الموزعة عبر القالب للبيانات الساخنة بالبقاء قريبة فعليًا من مجموعات الحوسبة، مما يقلل متوسط زمن الوصول للوصول ويحسن سلوك التماسك العام.
يعزز توسيع ذاكرة التخزين المؤقت خمسة أضعاف الذي تعلن عنه AWS هذه الضرورة المعمارية. يؤدي تغيير حجم SLC الخاص بـ Graviton4 بسعة 36 ميجابايت بهذا العامل إلى 180 ميجابايت، وبيان AWS الإضافي — 2.6X ذاكرة تخزين مؤقت إضافية لكل نواة، بضعف عدد النواة — يعني إجمالي 187 ميجابايت تقريبًا، وهو ما يتوافق مع L3 كبير ومتعدد الشرائح بدلاً من كتلة SLC واحدة، مما قد يؤدي إلى تعقيد التوجيه.
وأخيرًا، توفر التصميمات المستندة إلى L3 إمكانية تنبؤ أقوى بأداء المستأجرين المتعددين، وهو أمر بالغ الأهمية بالنسبة إلى AWS. في ظل أحمال العمل السحابية، تواجه ذاكرات التخزين المؤقت المشتركة تداخلًا كبيرًا بين المستأجرين وزمن وصول متغير، لذلك عند تصميم أنظمة فرعية لذاكرة التخزين المؤقت، يجب على المطورين أن يأخذوا في الاعتبار حالة استخدام AWS. لتلخيص الأمور، كان التحول إلى L3 الموزع تطورًا معماريًا ضروريًا لـ Graviton5.
نظام فرعي جديد للذاكرة، وميزات الإدخال/الإخراج، والأمان
مثلما لم تكشف AWS عن الكثير من التفاصيل حول جوانب التصميم الأخرى لـ Graviton5، فإنها أيضًا لم تكشف الكثير عن نظام الذاكرة الفرعي لوحدة المعالجة المركزية. وغني عن القول أن نظام الذاكرة الفرعي لـ Graviton5 أقوى من نظام Graviton4، لأنه يدعم سرعات ذاكرة أعلى، مما يعني على الأرجح أنه يحتفظ على الأقل بنظام فرعي للذاكرة مكون من 12 قناة من Graviton4، ولكن مع معدلات نقل بيانات أعلى (أي أعلى من DDR5-5600).
سيوفر تصميم DDR5 ذو 12 قناة يعمل بسرعة 6400 ميجابايت/ثانية حوالي 614 جيجابايت/ثانية من إجمالي عرض النطاق الترددي، وهو ما يُترجم إلى حوالي 3.2 جيجابايت/ثانية لكل نواة، وهو في الواقع أقل من 5.6 جيجابايت/ثانية لكل نواة في حالة Graviton4. ومع ذلك، يمكن أن تعوض ذاكرة التخزين المؤقت L3 الأكبر هذا الانخفاض في عرض النطاق الترددي للذاكرة. ثم مرة أخرى، نحن لا نعرف العدد الدقيق لقنوات الذاكرة التي يدعمها Graviton5.
تمت زيادة إنتاجية الإدخال/الإخراج بالمثل، وفقًا لـ AWS: ارتفع عرض النطاق الترددي للشبكة بنسبة 15% في المتوسط عبر أحجام المثيلات، مع ما يصل إلى ضعف الإنتاجية لأكبر التكوينات. يرتفع النطاق الترددي للتخزين عبر Amazon EBS بحوالي 20% في المتوسط، وفقًا لشركة AWS. تم تصميم هذه المكاسب لتحسين الأداء ليس فقط للتطبيقات ذات الحوسبة الثقيلة، ولكن أيضًا للأنظمة الموزعة التي تعتمد على التخزين السريع والشبكات.
على الجانب الأمني، تم بناء Graviton5 على نظام AWS Nitro، مع بطاقات Nitro من الجيل السادس التي تتعامل مع المحاكاة الافتراضية والشبكات والتخزين. قدمت AWS أيضًا مكونًا جديدًا يسمى Nitro Isolation Engine، والذي تصفه الشركة بأنه طبقة عزل تم التحقق منها رسميًا. بدلاً من الاعتماد فقط على التحقق من الأمان التقليدي، يستخدم Isolation Engine البراهين الرياضية لإثبات أن أعباء العمل منفصلة عن بعضها البعض وعن مشغلي AWS. تفرض البنية نموذج عدم وصول المشغلين، وتخطط AWS للسماح للعملاء بمراجعة التنفيذ والأدلة الرسمية التي تدعمه لضمان أقصى قدر من الأمان. يمكن أن تكون مثل هذه الإجراءات الأمنية جزءًا من جهود الشركة لجذب العملاء الذين استخدموا الخوادم المحلية بشكل تقليدي.
التفاف عليه
يوفر معالج Graviton5 الجديد من AWS وحدة معالجة مركزية تعتمد على 192 نواة وتقنية Arm 3nm مع حوالي 180 ميجابايت من ذاكرة التخزين المؤقت L3. وهذا يضع العملاق السحابي كمنافس لحلول AMD EPYC وIntel Xeon المتطورة لمراكز البيانات. تدمج وحدة المعالجة المركزية نوى Neoverse V3 وتوفر زيادة في الأداء مُعلن عنها بنسبة 25%، وهو أمر متحفظ نظرًا للزيادة المضاعفة في عدد النواة، والتحسينات الكبيرة في الهندسة المعمارية الدقيقة في Armv9.2 ISA، وزيادة بمقدار خمسة أضعاف في سعة ذاكرة التخزين المؤقت. تؤكد AWS أيضًا انخفاض زمن الوصول بين النواة بنسبة 33% بسبب التصميم الداخلي المعاد تصميمه، لكنها لم تكشف عما إذا كانت تستخدم Arm's CSS، مما يشير إلى أن Graviton5 قد يكون تصميمًا فريدًا من نوعه من Annapurna Labs مبني على نوى Neoverse V3.
يتمثل أحد التحولات المعمارية الرئيسية في استبدال SLC الخاص بـ Graviton4 بـ L3 كبير موزع لتمكين توسيع نطاق التماسك بشكل أفضل عبر 192 مركزًا ووقت استجابة يمكن التنبؤ به. يكتسب المعالج أيضًا نظامًا فرعيًا أسرع للذاكرة (من المحتمل أن يحتفظ بـ 12 قناة بسرعات DDR5 أعلى)، وتحسين النطاق الترددي للشبكة والتخزين، ومحرك Nitro Isolation Engine الجديد، الذي يستخدم التحقق الرسمي لضمان عزل المستأجر وفرض وصول بدون مشغل.
في الوقت الحالي، يعمل Graviton5 على تشغيل مثيلات EC2 M9g الجديدة – بما يصل إلى 30% – أسرع بنسبة 35% لقواعد البيانات وخدمات الويب والتعلم الآلي – وسيتبع ذلك متغيرات C9g المحسنة للحوسبة وR9g المحسنة للذاكرة في عام 2026.

التعليقات