
تتحدث صناعة التكنولوجيا بشكل متزايد عن كون وحدات معالجة الرسومات عنصرًا أساسيًا في البنية التحتية للذكاء الاصطناعي، ولكن العامل المحدد الذي يقرر النماذج التي يمكنك تشغيلها هو في الواقع الذاكرة.
في مقابلة واسعة النطاق، قال الرئيس التنفيذي لشركة Phison Pua Khein Seng، الذي اخترع أول محرك أقراص فلاش USB أحادي الشريحة في العالم، تك رادار برو لقد أدى التركيز على الحوسبة إلى تشتيت الانتباه عن القيود الأساسية التي تظهر في كل مكان، بدءًا من أجهزة الكمبيوتر المحمولة التي تعمل بالاستدلال المحلي وحتى المقياس الفائق الذي يبني مراكز بيانات الذكاء الاصطناعي.
قال بوا: “في نماذج الذكاء الاصطناعي، لا يكمن العائق الحقيقي في قوة الحوسبة، بل في الذاكرة”. “إذا لم يكن لديك ذاكرة كافية، يتعطل النظام.”
التعويض عن حدود DRAM
هذا هو السبب وراء عمل Phison's aiDAPTIV+، والذي ناقشته الشركة علنًا في معرض CES 2026، وهو في الأساس طريقة لتوسيع معالجة الذكاء الاصطناعي لتشمل أنظمة GPU المدمجة باستخدام NAND flash كمجموعة ذاكرة.
يصفها Pua بأنها تستخدم سعة SSD للتعويض عن حدود DRAM والحفاظ على تركيز وحدات معالجة الرسومات على الحوسبة بدلاً من انتظار الذاكرة.
يقول: “يستخدم اختراعنا محركات أقراص SSD كمكمل لذاكرة DRAM”. “نحن نستخدم هذا لتوسيع الذاكرة.”
الهدف العملي هو تحسين الاستجابة أثناء الاستدلال، وخاصة وقت الوصول إلى الرمز المميز الأول، والتأخير بين إرسال المطالبة ورؤية الناتج الأول. يقول Pua إن TTFT الطويلة تجعل الذكاء الاصطناعي المحلي يشعر بالكسر، حتى عندما يكمل النموذج المهمة في النهاية.
“إذا سألت جهازك شيئًا ما واضطررت إلى الانتظار لمدة 60 ثانية حتى تسمع الكلمة الأولى، هل ستنتظر؟” يقول. “عندما أطلب شيئًا ما، يمكنني الانتظار لمدة ثانيتين. ولكن إذا استغرق الأمر 10 ثوانٍ، فسيعتقد المستخدمون أنه قمامة.”
يربط Pua تحسينات TTFT بإعادة استخدام بيانات الاستدلال ذات الذاكرة الثقيلة بشكل أفضل، وخاصة ذاكرة التخزين المؤقت KV، ومقارنتها بطبيب يكرر نفس التعليمات لكل مريض لأنه لا يتم حفظ أي شيء بين الزيارات.
وأضاف: “في استدلال الذكاء الاصطناعي، هناك شيء يسمى ذاكرة التخزين المؤقت KV – إنها مثل ملفات تعريف الارتباط في تصفح الويب”. “معظم الأنظمة لا تحتوي على ما يكفي من ذاكرة الوصول العشوائي الديناميكية (DRAM)، لذلك في كل مرة تطرح فيها نفس السؤال، يجب إعادة حساب كل شيء.”
وأضاف Pua أن أسلوب Phison هو “تخزين ذاكرة التخزين المؤقت المستخدمة بشكل متكرر في وحدة التخزين” حتى يتمكن النظام من استردادها بسرعة عندما يكرر المستخدم استعلامًا أو يعيد زيارته.
يمتد تأطير الذاكرة أولاً إلى ما هو أبعد من أجهزة الكمبيوتر المحمولة ليشمل كيفية بناء الشركات لخوادم وحدة معالجة الرسومات، حيث تشير Pua إلى أن العديد من المؤسسات تشتري وحدات معالجة رسوميات إضافية ليس من أجل حساب الإنتاجية، ولكن لجمع المزيد من VRAM، مما يؤدي إلى إهدار السيليكون.
ويضيف: “بدون حلنا، يشتري الأشخاص بطاقات GPU متعددة في المقام الأول لتجميع الذاكرة، وليس من أجل قوة الحوسبة”. “معظم وحدات معالجة الرسوميات الباهظة الثمن ينتهي بها الأمر في وضع الخمول لأنها تُستخدم فقط لذاكرتها.”
يقول Pua إنه إذا تمكنت محركات أقراص SSD من توفير مجموعة ذاكرة أكبر، فيمكن شراء وحدات معالجة الرسومات وتوسيع نطاقها للحوسبة بدلاً من ذلك. ويشير إلى أنه “بمجرد أن يكون لديك ذاكرة كافية، يمكنك التركيز على سرعة الحوسبة. وإذا كانت إحدى وحدات معالجة الرسومات بطيئة، فيمكنك إضافة اثنتين أو أربع أو ثماني وحدات معالجة رسوميات لتحسين قوة الحوسبة.”
محركات أقراص SSD بسعة 244 تيرابايت
ومن هنا، وسّع بوا العدسة لتشمل اقتصاديات المقياس الفائق والبنية التحتية للذكاء الاصطناعي، واصفًا الموجة الحالية من إنفاق وحدة معالجة الرسومات بأنها ضرورية ولكنها غير مكتملة، لأن الحالة التجارية للذكاء الاصطناعي تعتمد على الاستدلال، والاستدلال يعتمد على تخزين البيانات.
ويقول: “لقد استثمر مقدمو خدمات الاتصالات ما يزيد عن 200 مليار دولار في وحدات معالجة الرسومات”. “إنهم لا يكسبون المال مباشرة من وحدات معالجة الرسوميات. فالإيرادات تأتي من الاستدلال، الأمر الذي يتطلب تخزين بيانات ضخمة.”
وقد لخص الموقف بعبارة عاد إليها مرارا وتكرارا: “ربح الطاقة الشمسية المركزة يساوي سعة التخزين”.
تغذي هذه الحجة أيضًا دفع Phison نحو محركات أقراص الحالة الصلبة الخاصة بالمؤسسات ذات السعة القصوى. أعلنت الشركة عن طراز بسعة 244 تيرابايت، وأخبرنا Pua، “يستخدم محرك الأقراص الحالي بسعة 122 تيرابايت وحدة التحكم X2 الخاصة بنا مع تكديس NAND مكون من 16 طبقة. وللوصول إلى 244 تيرابايت، نحتاج ببساطة إلى تكديس 32 طبقة. اكتمل التصميم، ولكن التحدي يكمن في إنتاجية التصنيع.”
كما حدد أيضًا طريقًا بديلاً مثيرًا للاهتمام: قوالب NAND ذات الكثافة العالية. وقال: “نحن ننتظر موت 4 تيرابايت من NAND، ومع ذلك، يمكننا تحقيق 244 تيرابايت مع 16 طبقة فقط”، مضيفًا أن التوقيت سيعتمد على نضج التصنيع.
فيما يتعلق بـ PLC NAND، كان Pua واضحًا أن Phison لا تتحكم في وقت وصولها، لكنه أخبرنا أنه ينوي دعمها بمجرد أن يتمكن المصنعون من شحنها بشكل موثوق.
وقال: “إن PLC عبارة عن NAND بخمسة بتات، وهذا في المقام الأول قرار صادر عن الشركة المصنعة لـ NAND، وليس قرارنا”. “عندما تنضج شركات NAND تقنية PLC الخاصة بها، ستكون تصميمات SSD الخاصة بنا جاهزة لدعمها.”
لقد كان أكثر تشككًا بشأن اتجاه تخزين مختلف: ربط الفلاش مباشرة بمكدسات الذاكرة على غرار وحدة معالجة الرسومات، والتي تتم مناقشتها أحيانًا تحت مسميات مثل الفلاش عالي النطاق الترددي. جادل بوا بأن عدم تطابق القدرة على التحمل يخلق وضع فشل سيئًا.
وقال: “إن التحدي المتمثل في دمج NAND مباشرة مع وحدات معالجة الرسومات هو قيود دورة الكتابة”. “تحتوي NAND على دورات محدودة للبرنامج/المسح. إذا قمت بدمجها، فعندما تصل NAND إلى نهاية عمرها الافتراضي، سيتعين عليك التخلص من بطاقة GPU الباهظة الثمن بالكامل.”
النموذج المفضل لشركة Phison هو نموذج معياري: “الاحتفاظ بمحركات أقراص SSD كمكونات قابلة للاستبدال، قابلة للتوصيل والتشغيل. عندما يبلى محرك SSD، يمكنك ببساطة استبداله مع الاحتفاظ بوحدة معالجة الرسومات باهظة الثمن.”
مجتمعة، فإن رؤية Pua لمستقبل أجهزة الذكاء الاصطناعي لا تتعلق بمطاردة وحدات معالجة الرسومات الأكبر حجمًا بقدر ما تتعلق ببناء أنظمة تكون فيها سعة الذاكرة رخيصة وقابلة للتطوير وقابلة للاستبدال.
سواء كان الهدف هو الاستدلال المحلي على وحدة معالجة الرسومات المدمجة أو الاستدلال على نطاق الحامل في مقياس فائق السرعة، فإن الشركة تراهن على أن كثافة التخزين وتوسيع الذاكرة سيحددان ما هو عملي قبل فترة طويلة من حدوث قفزة أخرى في الحوسبة.
اتبع TechRadar على أخبار جوجل و أضفنا كمصدر مفضل للحصول على أخبار الخبراء والمراجعات والآراء في خلاصاتك. تأكد من النقر على زر المتابعة!
وبالطبع يمكنك أيضًا اتبع TechRadar على TikTok للحصول على الأخبار والمراجعات وفتح الصناديق في شكل فيديو، والحصول على تحديثات منتظمة منا على واتساب أيضاً.

التعليقات