إن قدرات وكلاء تشفير الذكاء الاصطناعي مثل Claude Code وOpenAI's Codex تتسبب بالفعل في تحولات زلزالية في صناعة البرمجيات، ولكن إذا صدقنا ما كشفته Anthropic الأخيرة، فإن المزيد من الاضطراب في الطريق. في منشور مدونة جديد اليوم، كشف المختبر الحدودي وراء Claude أن أحدث طراز له، Claude Mythos Preview، قادر جدًا على اكتشاف الأخطاء لدرجة أنه عثر على “الآلاف من نقاط الضعف عالية الخطورة، بما في ذلك بعض الثغرات الموجودة في كل نظام تشغيل ومتصفح ويب رئيسي”.
نظرًا لإمكانيات Claude Mythos Preview المحتملة والواسعة النطاق، فإن Anthropic لا تطلقها للعالم فحسب، بل يجب أن تلعن العواقب. وبدلاً من ذلك، قام المختبر بجمع لاعبين رئيسيين عبر صناعات البرمجيات والأجهزة من أجل استخدام براعة Mythos في اكتشاف الأخطاء لتصحيح نقاط الضعف التي يكشفها بشكل استباقي قبل أن تتمكن مختبرات الذكاء الاصطناعي الحدودية الأخرى من نشر نماذج ذات قدرات مماثلة دون حواجز حماية مماثلة.
يستمر المقال أدناه
وكما يقول هؤلاء الباحثون أنفسهم، فإن الإصدارات الحالية من كلود قادرة على تحديد الثغرات الأمنية بشكل جيد، ولكنها عادةً ما تفشل فشلاً ذريعًا في مهمة تحويل تلك الثغرات الأمنية إلى عمليات استغلال نشطة. على النقيض من ذلك، فإن Mythos قادرة على تحويل 72.4% من الثغرات الأمنية التي تحددها إلى عمليات استغلال ناجحة داخل نطاق غلاف JavaScript الخاص بـ Firefox، وهي قادرة على تحقيق التحكم في التسجيل في 11.6% أخرى من محاولات الهجمات.
يصف فريق Frontier Red التابع لـ Anthropic على نطاق واسع التهديد الذي قد يشكله إصدار Mythos الجامح على صناعة البرمجيات المطمئنة، ويوضح أحد الأمثلة على ممارسات القياس الداخلي الخاصة به بوضوح ما هو على المحك: “نحن ندير نماذجنا بانتظام على ما يقرب من ألف مستودع مفتوح المصدر من مجموعة OSS-Fuzz، ونصنف أسوأ الأعطال التي يمكن أن تنتجها على سلم من خمسة مستويات من الخطورة المتزايدة، تتراوح من الأعطال الأساسية (المستوى 1) إلى تدفق التحكم الكامل الاختطاف (المستوى 5).
مع تشغيل واحد لكل نقطة من نقاط الدخول البالغ عددها 7000 تقريبًا إلى هذه المستودعات، وصل Sonnet 4.6 وOpus 4.6 إلى المستوى 1 بين 150 و175 حالة، والمستوى 2 حوالي 100 مرة، لكن كل منهما حقق حادثًا واحدًا فقط في المستوى 3. في المقابل، حققت Mythos Preview 595 حادثًا في المستويين 1 و2، وأضافت عددًا قليلًا من الحوادث في المستويين 3 و3. 4 و حققت السيطرة الكاملة على تدفق التدفق على عشرة أهداف منفصلة ومصححة بالكامل (الطبقة 5).”
توفر Anthropic أيضًا العديد من الأمثلة الواقعية لأنواع الأخطاء التي كشفها Mythos، بما في ذلك ثغرة عمرها 27 عامًا في نظام التشغيل OpenBSD الشهير الذي كان من شأنه أن يسمح للمهاجم بتعطل النظام بمجرد الاتصال به، وثغرة أمنية عمرها 16 عامًا في مكتبة FFmpeg الأساسية التي تقول Anthropic إنها “تم اختراقها خمسة ملايين مرة بواسطة أدوات الاختبار الآلية دون اكتشاف المشكلة على الإطلاق”، وسلسلة استغلال أخرى في نواة Linux من شأنها أن تسمح المهاجم لتحقيق وصول الجذر إلى النظام المضيف.
باستخدام أداة قادرة جدًا على تحديد الثغرات، تقول Anthropic إنها تجري كشفًا مسؤولاً عن الثغرات الأمنية التي تجدها، ولكن نظرًا لحجم المشكلات التي يتم اكتشافها، يقول المختبر أن أقل من 1% من الأخطاء المحتملة التي تم اكتشافها قد تم تصحيحها بالكامل.
للمضي قدمًا، تقول Anthropic إنها لن تجعل Claude Mythos Preview متاحة للاستخدام العام، وبدلاً من ذلك تقوم بتوصيف الكثير من سلوكها من خلال بطاقة نظام النموذج. على المدى الطويل، يأمل المختبر أنه من خلال إتاحة Mythos لمجموعة فرعية محدودة من الشركاء الآن، يمكن أن يساعد في إرساء الأساس لمساعدة تلك الشركات والمؤسسات على الاستعداد لعالم تصبح فيه نماذج هذه الفئة شائعة.
على أي حال، من الواضح أن النمو في قدرة نماذج الذكاء الاصطناعي الرائدة لا يتباطأ في مجالات معينة من الخبرة، وأن التأثيرات المدمرة المحتملة لهذه النماذج على العالم ليست سوى مستودع واحد بعيدًا عن إحداث الفوضى في الأيدي الخطأ. لا يسعنا إلا أن نأمل أن تكون المختبرات التي تسعى إلى تحقيق قدرات مماثلة من خلال نماذجها الرائدة مسؤولة بنفس القدر الذي يبدو أن أنثروبيك تبدو عليه في توصيف تلك المخاطر والتخفيف من حدتها قبل أن تسبب ضررًا في العالم الحقيقي.
يتبع أجهزة توم على أخبار جوجل، أو أضفنا كمصدر مفضل، للحصول على آخر الأخبار والتحليلات والمراجعات في خلاصاتك.

التعليقات