
أصبحت أجهزة تسريع الذكاء الاصطناعي باهظة الثمن بشكل متزايد، حيث تتطلب رقائق الجيل التالي ميزانيات طاقة عالية واستثمارات كبيرة في البنية التحتية. بالنسبة للعديد من الشركات الناشئة والمؤسسات الصغيرة، فإن تكلفة وتعقيد نشر الذكاء الاصطناعي على نطاق واسع يخلق حواجز قبل وقت طويل من بدء تطوير البرمجيات.
يحاول لاعبو السيليكون الجدد مثل FuriosaAI إعادة التفكير في هذه المعادلة، مع التركيز على الكفاءة والأداء والأساليب البديلة للسوق التي تهيمن عليها وحدات معالجة الرسومات.
تعمل شركة FuriosaAI، التي تأسست في كوريا الجنوبية، على تطوير شرائح استدلال الذكاء الاصطناعي المصممة لتقديم أداء عالٍ مع تقليل استهلاك الطاقة وإجهاد مركز البيانات. تم تصميم أحدث معالج لها، RNGD، حول بنية Tensor Contraction Processor الخاصة بالشركة ويهدف إلى تشغيل نماذج الذكاء الاصطناعي المطلوبة دون الاعتماد على أطر عمل GPU التقليدية.
- تاريخيًا، قدمت اليابان وأوروبا بعض الشركات الكبرى (ST Electronics وNEC وما إلى ذلك)، فلماذا يوجد عدد قليل جدًا من الشركات العاملة في مجال الذكاء الاصطناعي خارج الصين والولايات المتحدة؟
أولاً، أود أن أتحدى فرضيتك، على الأقل قليلاً: عدد قليل جدًا من الشركات الناشئة في مجال الأجهزة في أي مكان حققت نجاحات ضد هيمنة Nvidia في الذكاء الاصطناعي. حتى بعد مرور عقد ونصف على AlexNet، ما زلنا في الأيام الأولى لهذه الصناعة. وفي الواقع، ظهر بعض مبتكري أجهزة الذكاء الاصطناعي، مثل هايلو وأكسليرا، خارج الولايات المتحدة أو الصين.
لكن القائمة قصيرة لأسباب هيكلية.
على عكس تعدين العملات المشفرة، حيث تكون الخوارزميات ثابتة وتعمل أجهزة ASIC البسيطة بشكل جيد، فإن الذكاء الاصطناعي يتقدم ويتطور بسرعة.
يتطلب بناء شريحة لهدف متحرك كلا من الأجهزة وخبرة المترجمين، والتي تميل إلى التجمع في أماكن ذات تراث قوي من أشباه الموصلات. لا يوجد سوى عدد قليل من الأماكن في العالم التي تتمتع بعلاقات عميقة مع الشركات المصنعة وشركاء تصنيع الرقائق.
وهذا هو السبب في أن التواجد في كوريا الجنوبية كان في الواقع ميزة تنافسية لشركة Furiosa.
لقد تمكنا من الوصول إلى المواهب من البرامج الهندسية ذات المستوى العالمي في الجامعات الكورية وعمالقة التكنولوجيا الكورية. كما تمكنا أيضًا من تطوير شراكات مع شركات رائدة في كوريا (مثل SK Hynix لتوفير HBM3 لشريحة استدلال الرقاقة من الجيل الثاني، RNGD) وأماكن أخرى في آسيا (مثل شريكنا في المسبك، TSMC، في تايوان).
كما أجبرتنا المسافة من وادي السيليكون على اتباع نهج منضبط للغاية. تم إطلاق Furiosa بتمويل أولي قدره مليون دولار أمريكي فقط وأمضينا عدة سنوات في تحسين أفكارنا قبل شحن السيليكون.
لقد التزمنا تمامًا بنهجنا القائم على الانكماش الموتر وتمكنا من تجاهل الحكمة التقليدية والضجيج في الوادي.
لكن الأجهزة يجب أن تتنافس في السوق العالمية؛ لا يمكننا أن نكون مجرد مزود إقليمي. الآن بعد أن قمنا بشحن RNGD بكميات كبيرة، فإننا نعمل مع عملاء المؤسسات في جميع أنحاء العالم.
- الأجهزة ليست سوى جزء من المعادلة وقد استغرقت شركة Nvidia سنوات لبناء خندقها البرمجي سيئ السمعة (CUDA). ما الذي تفعله Furiosa للتنافس مع خصمها الهائل؟
إن محاولة تكرار مكتبة CUDA الضخمة من Nvidia هي طريق مسدود استراتيجي.
لقد اتخذنا مسارًا أكثر جرأة من خلال التصميم المشترك لأجهزتنا وبرامجنا استنادًا إلى المبادئ الأولى المخصصة للذكاء الاصطناعي، لذلك لن نضطر إلى إعادة إنشاء CUDA.
تستخدم رقائقنا بنية معالج Tensor Contraction Processor (TCP) الخاصة بشركة Furiosa، والتي تنفذ أصلاً الرياضيات متعددة الأبعاد للتعلم العميق بدلاً من فرضها على الهياكل القديمة التي تستخدمها وحدات معالجة الرسومات.
يتيح ذلك لمترجمنا تحسين النماذج دون الحاجة إلى آلاف النوى المضبوطة يدويًا.
يوضح RNGD، الذي يتم الآن إنتاجه بكميات كبيرة، مزايا النهج الذي نتبعه. فهو يوفر استدلالًا عالي الأداء للنماذج الأكثر تطلبًا في العالم بينما يستهلك 180 واط فقط (مقارنة بـ 600 واط أو أكثر التي تتطلبها وحدات معالجة الرسومات).
لقد أثبت الشركاء العالميون مثل LG AI Research هذه الكفاءة المذهلة في الإنتاج.
لقد قمنا أيضًا بكسر قفل CUDA من خلال بناء مجموعة برامجنا للتكامل بسلاسة مع الأدوات القياسية مثل PyTorch وvLLM حتى يتمكن المطورون من الوصول إلى هذا الأداء دون تغيير سير العمل الخاص بهم.
- ببطء، تقوم أكبر شركات التوسع الفائق ببناء حلول شرائح الذكاء الاصطناعي الخاصة بها (جوجل، ومايكروسوفت، وأمازون) لتقليل اعتمادها على أطراف ثالثة. أين يقع فيوريوسا (وآخرون) في تلك الصورة؟
يخلق نموذج GPU الحالي تحديات هائلة في مجال الطاقة واختناقات في البنية التحتية للصناعة بأكملها، بما في ذلك أجهزة التوسعة الفائقة. نحن نرى مستقبلًا محددًا من خلال الحوسبة غير المتجانسة، حيث تعمل البنى المختلفة جنبًا إلى جنب لخدمة الاحتياجات المختلفة (مثل التدريب مقابل الاستدلال) بشكل أكثر فعالية.
ونظرًا لأننا نعطي الأولوية للتكلفة الإجمالية للملكية وكفاءة الطاقة والمرونة، فإن تقنيتنا ستلعب دورًا مركزيًا في حل هذه المشكلة للجميع.
ينصب تركيزنا الآن على أربعة قطاعات محددة تشعر بالقوة ومتاعب الأشعة تحت الحمراء بشكل حاد:
● تحتاج الدول والصناعات الخاضعة للتنظيم إلى العمل مع البيانات الحساسة محليًا، وليس في السحابة العامة. تسمح لهم RNGD بنشر الاستدلال عالي الأداء ضمن مظاريف الطاقة الحالية الخاصة بهم، مما يضمن سيادة البيانات دون الحاجة إلى مشاريع بنية تحتية جديدة ضخمة.
● بالنسبة لعملاء المؤسسات، تعد التكلفة الإجمالية للملكية والمرونة أمرًا أساسيًا. يتناسب RNGD مع الرفوف القياسية المبردة بالهواء بقدرة 15 كيلو وات ويتجنب تعديلات التبريد السائل الباهظة الثمن التي تتطلبها وحدات معالجة الرسومات القديمة، مما يجعلها الطريقة الأسرع والأكثر فعالية من حيث التكلفة للتوسع.
● تحتاج السحابات الإقليمية والمتخصصة إلى التنافس مع الشركات الثلاث الكبرى على الهوامش. تسمح كثافة الحوسبة العالية لـ RNGD لمزودي خدمات الاتصالات (CSP) بزيادة الإيرادات لكل حامل إلى الحد الأقصى مع الحفاظ على انخفاض OpEx.
● تعمل قطاعات أخرى، مثل شركات الاتصالات، مع بيئات مراكز البيانات ذات الطاقة المحدودة على حافة الشبكة. وتلبي كفاءة استخدام الطاقة في RNGD احتياجاتهم أيضًا.
ستستهدف شريحة الجيل التالي الخاصة بنا، والتي هي قيد التطوير حاليًا، المتوسعين بشكل مباشر إلى جانب هذه القطاعات الرئيسية.
- كيف ترى تطور مستقبل مركز البيانات (أنت تزور مركز بيانات في عام 2036، ماذا ترى بداخله)؟
في غضون 10 سنوات، سيعني “مركز البيانات” العديد من الأشياء المختلفة، تمامًا كما أصبح مصطلح “الكمبيوتر” يشير إلى كل شيء بدءًا من ساعتك الذكية وحتى الخادم عالي الأداء.
ستكون بعض مراكز البيانات من النوع المستقبلي الذي تتخيله: هائل و(ربما) يعمل بالاندماج النووي أو يدور حول الأرض. لكن بعضها الآخر سيكون صغيرًا ومفرط الكفاءة.
على سبيل المثال، سيكون لدى المستشفى المحلي الخاص بك مركز بيانات داخلي يعمل بالذكاء الاصطناعي لتشغيل مساعدين أذكياء للأطباء والممرضات، مما يحافظ على زمن الوصول منخفضًا والبيانات محلية وآمنة.
سيكون لدى شركات الاتصالات العديد من مراكز بيانات الذكاء الاصطناعي “المتطورة” عالية الأداء المُحسّنة لزمن وصول منخفض جدًا.
الشيء الوحيد الذي أنا متأكد منه هو أن مراكز بيانات الذكاء الاصطناعي لعام 2036 لن تكون مليئة بوحدات معالجة الرسومات. سيكون عبارة عن مجموعة متنوعة من السيليكون المخصص للذكاء الاصطناعي لتلبية الاحتياجات المختلفة.
ويرجع ذلك جزئيًا إلى عدم كفاءة طاقة وحدات معالجة الرسومات. ولكن بشكل أساسي، هناك اتفاق واسع النطاق على أن بنية وحدة معالجة الرسومات ليست مثالية للذكاء الاصطناعي.
لقد عمل صانعو وحدات معالجة الرسومات على سد هذه الفجوة من خلال ابتكارات مثل إضافة نوى موتر إلى شرائحهم، ولكن في نهاية المطاف فإن فوائد الانتقال من وحدات معالجة الرسومات إلى بنيات الذكاء الاصطناعي الأولى ستكون كبيرة جدًا بحيث لا يمكن تجاهلها.
- دون تقديم الكثير من التفاصيل لخريطة الطريق الخاصة بك، هل ستتبع شركة Furiosa silicon المسار التقليدي لمنتجات الذكاء الاصطناعي؟
ينصب تركيزنا الآن ومع المنتجات المستقبلية على تقديم أكثر ما يحتاجه عملاء المؤسسات: استدلال مركز بيانات عالي الأداء يتميز أيضًا بالكفاءة في استخدام الطاقة، وفعالية من حيث التكلفة، وسهل النشر دون ترقيات ضخمة للبنية التحتية.
وهذا يعني تحديد أولويات المقاييس مثل الرموز المميزة لكل واط والرموز المميزة لكل حامل لزيادة كثافة الحوسبة.
وسنعمل أيضًا على الاستفادة بقوة من التطورات الجديدة في الصناعة، مثل العقد الأصغر وتقنيات الذاكرة الجديدة.
استخدمت شريحة الجيل الأول لدينا عقدة بحجم 14 نانومتر. تستخدم شريحة RNGD الخاصة بنا HBM3 وعقدة 5 نانومتر وسنستمر في التقدم. لكن ابتكارنا المعماري هو الذي يمكننا من تحقيق أداء أفضل وأكثر كفاءة في استخدام الطاقة من وحدات معالجة الرسومات المبنية على نفس العقدة.
هناك شيء آخر يجب ملاحظته حول خريطة الطريق الخاصة بنا وهو أنها تتعلق بالبرمجيات بقدر ما تتعلق بالأجهزة. لدى Furiosa مهندسو برمجيات أكثر من مهندسي الأجهزة لأنه يجب علينا الاستمرار في دعم النماذج الجديدة وأدوات النشر بسرعة وفعالية.
لقد أصدرنا ثلاثة تحديثات رئيسية لـ SDK في عام 2025 وسنحافظ على هذه الوتيرة في عام 2026 وما بعده.
- فوريوزا تنحدر من كوريا الجنوبية. كيف تنظر الشركات العملاقة (سامسونج، إل جي، هيونداي، إس كيه هاينكس) إلى هذه الشركة الناشئة؟ ما هي الشراكات الموجودة حاليا؟
لقد عملنا مع كبار رواد التكنولوجيا الكوريين كشركاء وعملاء: قامت Samsung Foundry بتصنيع شريحة الجيل الأول لدينا، وتوفر SK Hynix ذاكرة HBM3 لـ RNGD، وتعد LG أحد عملاء المؤسسات الرائدين الذين يقومون حاليًا بنشر السيليكون الخاص بنا. هذه علاقات عميقة تمت صياغتها على مدى سنوات عديدة.
وبعيدًا عن التكتلات، فإننا نعمل مع شركات ناشئة في مجال الذكاء الاصطناعي ومقرها كوريا وقادرة على المنافسة عالميًا مثل Upstage، ونستفيد من المستهلكين الكوريين الذين يتمتعون بالذكاء الاصطناعي والقاعدة الصناعية الكبيرة في قطاعات السيارات وبناء السفن وغيرها من القطاعات.
يعد الذكاء الاصطناعي أيضًا أولوية سياسية قصوى للحكومة الكورية. طرح الرئيس الكوري مبادرات طموحة لتصبح قوة عالمية في مجال الذكاء الاصطناعي، مع وجود رقائق الذكاء الاصطناعي في المركز.
نحن متحمسون جدًا للزخم الذي حققته كوريا في مجال الذكاء الاصطناعي، وهذا من شأنه أن يعزز النظام البيئي الجديد الذي نبنيه لنقل الصناعة إلى ما هو أبعد من وحدات معالجة الرسومات.
اتبع TechRadar على أخبار جوجل و أضفنا كمصدر مفضل للحصول على أخبار الخبراء والمراجعات والآراء في خلاصاتك. تأكد من النقر على زر المتابعة!
وبالطبع يمكنك أيضًا اتبع TechRadar على TikTok للحصول على الأخبار والمراجعات وفتح الصناديق في شكل فيديو، والحصول على تحديثات منتظمة منا على واتساب أيضاً.

التعليقات