اليوم، قدمت Google Cloud مثيلات جديدة موجهة نحو الذكاء الاصطناعي، مدعومة بوحدات المعالجة المركزية Axion ووحدات Ironwood TPU الخاصة بها. تهدف المثيلات الجديدة إلى كل من التدريب والاستدلال بزمن وصول منخفض لنماذج الذكاء الاصطناعي واسعة النطاق، والميزة الرئيسية لهذه المثيلات الجديدة هي التوسع الفعال لنماذج الذكاء الاصطناعي، والذي تم تمكينه من خلال الحجم العالمي الكبير جدًا لأنظمة Google المستندة إلى Ironwood.
ملايين من مادة Ironwood TPU للتدريب والاستدلال.
يمكن ضم كبسولات Ironwood – المبنية على وحدات المعالجة المركزية Axion وIronwood TPU – إلى مجموعات تشغل مئات الآلاف من وحدات TPU، والتي تشكل جزءًا من حاسوب Google الفائق الذي يطلق عليه اسم AI Hypercomputer. إنها منصة حوسبة فائقة متكاملة تعمل على توحيد الحوسبة والتخزين والشبكات تحت طبقة إدارة واحدة. لتعزيز موثوقية كل من الكبسولات الكبيرة جدًا والكمبيوتر الفائق الذي يعمل بالذكاء الاصطناعي، تستخدم Google نسيجها القابل لإعادة التشكيل، المسمى Optical Circuit Switching، والذي يتجنب على الفور أي انقطاع في الأجهزة للحفاظ على التشغيل المستمر.
تنسب بيانات IDC الفضل إلى نموذج الذكاء الاصطناعي Hypercomputer بمتوسط عائد على الاستثمار يبلغ 353% لمدة ثلاث سنوات، وانخفاض الإنفاق على تكنولوجيا المعلومات بنسبة 28%، وكفاءة تشغيلية أعلى بنسبة 55% لعملاء المؤسسات.
تتبنى العديد من الشركات بالفعل منصة Google المستندة إلى Ironwood. وتخطط شركة Anthropic لاستخدام ما يصل إلى مليون وحدة TPU لتشغيل وتوسيع مجموعة طرازات Claude الخاصة بها، مستشهدة بمكاسب كبيرة من حيث التكلفة مقابل الأداء. بدأت Lightricks أيضًا في نشر Ironwood لتدريب وخدمة نظام الوسائط المتعددة LTX-2 الخاص بها.
وحدات المعالجة المركزية Axion: قامت Google أخيرًا بنشر معالجات مصممة داخليًا
على الرغم من أن مسرعات الذكاء الاصطناعي مثل Ironwood من Google تميل إلى سرقة كل الأضواء في عصر الذكاء الاصطناعي للحوسبة، إلا أن وحدات المعالجة المركزية (CPUs) لا تزال ذات أهمية بالغة لمنطق التطبيقات واستضافة الخدمات بالإضافة إلى تشغيل بعض أعباء عمل الذكاء الاصطناعي، مثل استيعاب البيانات. لذلك، جنبا إلى جنب مع 7ذ من خلال جيل TPU، تنشر Google أيضًا أول معالجاتها للأغراض العامة المستندة إلى Armv9، والتي تسمى Axion.
لم تنشر Google مواصفات القالب الكاملة لوحدات المعالجة المركزية Axion الخاصة بها: لا يوجد عدد أساسي مؤكد لكل قالب (يتجاوز ما يصل إلى 96 وحدة معالجة مركزية افتراضية وما يصل إلى 768 جيجابايت من ذاكرة DDR5 لمثيل C4A Metal)، ولا توجد سرعات ساعة معلنة، ولا توجد عقدة عملية مفصلة علنًا للجزء. ما نعرفه هو أن Axion مبني على منصة Arm Neoverse v2، وهو مصمم لتقديم أداء أكبر بنسبة تصل إلى 50% وكفاءة أعلى في استخدام الطاقة بنسبة تصل إلى 60% مقارنة بوحدات المعالجة المركزية x86 الحديثة، بالإضافة إلى أداء أعلى بنسبة 30% من “أسرع مثيلات Arm للأغراض العامة المتاحة في السحابة اليوم”. هناك تقارير تفيد بأن وحدة المعالجة المركزية توفر 2 ميجابايت من ذاكرة التخزين المؤقت L2 الخاصة لكل نواة، و80 ميجابايت من ذاكرة التخزين المؤقت L3، وتدعم ذاكرة DDR5-5600 MT/s، والوصول الموحد للذاكرة (UMA) للعقد.
تأتي الخوادم التي تشغل وحدات المعالجة المركزية Axion ووحدات المعالجة المركزية Ironwood من Google مجهزة بوحدات التحكم المخصصة التي تحمل علامة Titanium التجارية الخاصة بالشركة، والتي تعمل على إلغاء تحميل الشبكات والأمن ومعالجة تخزين الإدخال/الإخراج من وحدة المعالجة المركزية المضيفة، مما يتيح إدارة أفضل، مما يؤدي إلى أداء أعلى.
بشكل عام، يمكن لوحدات المعالجة المركزية Axion أن تخدم كلاً من خوادم الذكاء الاصطناعي والخوادم ذات الأغراض العامة لمجموعة متنوعة من المهام. في الوقت الحالي، تقدم Google ثلاثة تكوينات لـ Axion: C4A وN4A وC4A المعدنية.
يعد C4A هو العرض الأول والأساسي في عائلة Google من المثيلات التي تعمل بنظام Axion، وهو أيضًا العرض الوحيد المتاح بشكل عام اليوم. فهو يوفر ما يصل إلى 72 وحدة معالجة مركزية افتراضية (vCPUs)، وذاكرة DDR5 بسعة 576 جيجابايت، وشبكة بسرعة 100 جيجابايت في الثانية، مقترنة بتخزين Titanium SSD بسعة تصل إلى 6 تيرابايت من السعة المحلية. تم تحسين المثيل لتحقيق أداء عالٍ مستدام عبر التطبيقات المختلفة.
التالي هو مثيل N4A الذي يستهدف أيضًا أعباء العمل العامة مثل معالجة البيانات وخدمات الويب وبيئات التطوير، ولكنه يصل إلى 64 وحدة معالجة مركزية افتراضية و512 جيجابايت من ذاكرة الوصول العشوائي DDR5 وشبكات بسرعة 50 جيجابايت في الثانية، مما يجعله عرضًا أقل تكلفة.
نموذج المعاينة الآخر هو C4A Metal، وهو تكوين معدني من المفترض أن يعرض مجموعة أجهزة Axion الكاملة مباشرة للعملاء: ما يصل إلى 96 وحدة معالجة مركزية افتراضية، وذاكرة DDR5 بسعة 768 جيجابايت، وشبكات بسرعة 100 جيجابت في الثانية. هذا المثيل مخصص للتطبيقات المتخصصة أو المقيدة بالترخيص أو التطوير الأصلي للذراع.
مجموعة كاملة من السيليكون المخصص
تم بناء عمليات الإطلاق الجديدة هذه على عقد من تطوير السيليكون المخصص من Google والذي بدأ باستخدام مادة TPU الأصلية واستمر من خلال وحدات VCU في YouTube ومعالجات Tensor المحمولة والبنية التحتية Titanium. تُكمل وحدة المعالجة المركزية Axion – أول معالج خادم للأغراض العامة قائم على Arm من Google – مجموعة الرقائق المخصصة للشركة، ويمهد Ironwood TPU الطريق للمنافسة ضد أفضل مسرعات الذكاء الاصطناعي في السوق.
يتبع أجهزة توم على أخبار جوجل، أو أضفنا كمصدر مفضل، للحصول على آخر الأخبار والتحليلات والمراجعات في خلاصاتك.

التعليقات