
كثيرا ما يتم تأطير الطفرة في أدوات الذكاء الاصطناعي على أنها سباق لتأمين وحدات معالجة الرسومات قبل أي شخص آخر. يتم قياس موقع المتسابق عادةً في مقياس CapEx الفائق وشراكات الرقائق وعدد وحدات Nvidia المنشورة.
ومع ذلك، عندما يكافح ثلثا المؤسسات من أجل مركزية بياناتها، وأقل من ربعها (23%) أبلغ عن قدرة قوية لوحدة معالجة الرسومات، فإن السباق يغير مساره. ولم يعد الأمر أشبه بسباق سريع للسيليكون المتناثر، ولكنه يبدو أشبه بحالة من الجمود في ساعة الذروة من العناقيد ذات الاتصال الضعيف.
رئيس الشؤون الدولية في vCluster.
ويأتي عنق الزجاجة هذا في وقت يتزايد فيه القلق بشأن السيادة الرقمية. ويصف الوزراء الأوروبيون الآن البنية التحتية الرقمية بأنها “مسألة بقاء وطني”، محذرين من أن الاعتماد على الأنظمة المغلقة الخاضعة لسيطرة أجنبية يخلق نقاط ضعف استراتيجية.
يستمر المقال أدناه
ومع سيطرة مقدمي الخدمات السحابية في الولايات المتحدة على ما يقرب من 85% من السوق الأوروبية ــ ومن المتوقع أن يتضاعف الإنفاق السحابي السيادي إلى أكثر من ثلاثة أمثاله بمقدار 23 مليار دولار بحلول عام 2027 ــ فإن الضغوط من أجل تأمين السيطرة مستمرة بشكل جيد وحقيقي.
ندرة GPU أمر حقيقي. لكن الكثير من القيود التي نواجهها اليوم هي نتيجة لبيئات Kubernetes المجزأة، والمجموعات المكررة، والبنية التحتية لتكنولوجيا المعلومات التي لم يتم تصميمها مطلقًا للتوسع الآمن والفعال على النطاق الذي يتطلبه الذكاء الاصطناعي. بالنسبة للعديد من المؤسسات، أصبح Kubernetes هو النظام الافتراضي لتشغيل التطبيقات الحديثة.
إنه بمثابة منصة تنسيق، وإدارة الحاويات، وتخصيص موارد الحوسبة، والحفاظ على سير كل شيء بشكل موثوق عبر الخوادم. يتم تجميعها في مجموعات: مجموعات من قوة الحوسبة التي تستخدمها الفرق لتشغيل أعباء العمل.
المشكلة هي أن Kubernetes تم تصميمه في عصر ما قبل الذكاء الاصطناعي، عندما كانت أعباء العمل أخف بكثير. إنه أقل تحسينًا بكثير لمشاركة موارد GPU النادرة وعالية القيمة، ولهذا السبب بدأت الشقوق في الظهور.
التكلفة الخفية (والمتزايدة) للتوسع العنقودي
في ظل الاندفاع لنشر الذكاء الاصطناعي بشكل آمن، لجأت العديد من المؤسسات إلى العزلة عن طريق الازدواجية. وهذا يعني إنشاء مجموعات وبيئات منفصلة تمامًا لكل فريق أو عبء عمل، بدلاً من مشاركة نفس البنية التحتية الأساسية بشكل آمن.
من الناحية العملية، إذا احتاج فريق واحد إلى الاستقلالية، فإنه يحصل على مجموعته الخاصة. إذا كان عبء عمل فريق آخر حساسًا، فسيتم فصله جسديًا وليس منطقيًا. إذا كانت الإدارة معقدة، فإن الإجابة الأسهل هي حماية البنية التحتية بدلاً من إعادة التفكير في كيفية مشاركتها. والنتيجة هي الزحف العنقودي على نطاق واسع.
ورغم أن كل مجموعة قد تبدو وكأنها قرار معقول للحد من المخاطر، فإن الواقع هو أنها تتحول إلى عبء اقتصادي. تعد البيئات المدعومة بوحدة معالجة الرسوميات (GPU) باهظة التكلفة، ولكن من الأكثر تكلفة تركها غير مستغلة بشكل كافٍ. عند تركها مجزأة بين الفرق، تنخفض رؤية المجموعات بينما تزداد سعة الخمول.
هذا أكثر بكثير من مجرد صداع تشغيلي. وأوجه القصور الهيكلية مثل هذه تؤدي إلى تآكل العائد على الاستثمار. وينبغي النظر إلى وحدات معالجة الرسوميات على أنها أصول رأسمالية، وليست أجهزة تجريبية مخفية في ميزانيات البحث والتطوير. إن تركهم عالقين خلف الصوامع يعادل بناء محطة لتوليد الطاقة وتشغيلها بنصف طاقتها، وذلك ببساطة لأن الشبكة غير قادرة على توزيع الكهرباء بكفاءة.
ربما يكون Kubernetes قد أحدث تحولًا في كيفية إنشاء البنية التحتية وتشغيلها، لكنه لم يتم تصميمه مطلقًا مع وضع مشاركة وحدة معالجة الرسومات (GPU) متعددة المستأجرين في الاعتبار. بعبارات بسيطة، يسمح هذا لفرق أو أحمال عمل متعددة بمشاركة نفس البنية التحتية الأساسية بأمان، كل ذلك بحدود واضحة وعزل وحوكمة دون تكرار الأجهزة نفسها.
بدون وجود إيجارات متعددة حقيقية، تتعرض البيئات المشتركة لأعباء عمل الذكاء الاصطناعي. إنه يترك الاختيار بين التنازل عن العزلة أو التراجع إلى مجموعات مخصصة. لا المقاييس، والنموذج لا يمكن الدفاع عنه. ولهذا السبب فإن رواية نقص وحدة معالجة الرسومات تحجب عيبًا أعمق بكثير.
السيادة تزيد من حدة الجدل بشأن الإيجار
إن نقل أعباء العمل إما داخل الشركة أو إلى بيئات ذات سيادة لا يحل مشكلة عدم الكفاءة بطريقة سحرية. في الواقع، يمكن تضخيمه. عندما تقوم المؤسسات بتقريب البنية التحتية للذكاء الاصطناعي من المنزل لتلبية المخاوف التنظيمية أو الأمنية أو الجيوسياسية، فإنها تتحمل المسؤولية الكاملة عن استخدامها. غير أن هذه الملكية، دون تنسيق، لا يمكن اعتبارها سيادة. انها مجرد النفقات العامة.
مع استمرار تسارع أعباء عمل الذكاء الاصطناعي، لن يكون السباق نحو الحصول على الأجهزة، بل نحو النشر الآمن وتحقيق الدخل بكفاءة. ويتطلب ذلك وجود طبقة تحكم مصممة خصيصًا لاقتصاديات الذكاء الاصطناعي، مثل البرامج التي تقع فوق البنية التحتية الأولية وتحكم كيفية تخصيص الحوسبة ومشاركتها وعزلها.
وهذا يتيح العزلة دون ازدواجية، والحوكمة دون احتكاك، والاستقلالية دون توسع. سوف يظهر تعدد الإيجارات الحقيقية كطبقة مفقودة من حوسبة الذكاء الاصطناعي، مما يحافظ على كل من الامتثال والأداء مع إطلاق العنان للاستغلال الأعلى.
ومع احتلال السيادة مكانة عالية في جدول الأعمال، فإن الإيجارات المتعددة ستعيد وضع المرونة كعملية مدمجة. وبدلاً من الاستجابة للقيود المفروضة على القدرات من خلال إنفاق مبالغ هائلة، يمكن للمؤسسات تحسين ما تمتلكه بالفعل. لا يجب أن تبرر أعباء العمل الجديدة إنشاء مجموعات جديدة عندما تكون أصلًا مشتركًا يتم التحكم فيه بذكاء.
في أي سباق، السرعة الأولية ليست سوى جزء من المعادلة. غالبًا ما تحدد السيطرة والتنسيق والقدرة على التنقل بين التعقيدات مدى استمرار الزخم. البنية التحتية للذكاء الاصطناعي لا تختلف. وإلى أن يتم تصميمه على نطاق آمن ومشترك، لن يتمكن أي قدر من السرعة الخام من تحقيق إمكاناته الحقيقية.
اقرأ قائمتنا لأفضل أدوات إدارة تكنولوجيا المعلومات.

التعليقات