يحدد أحدث نموذج للذكاء الاصطناعي من Anthropic "الآلاف من نقاط الضعف في يوم الصفر" في "كل نظام تشغيل رئيسي وكل متصفح ويب رئيسي" - تثير Claude Mythos Preview السباق لإصلاح الأخطاء الحرجة، والتي لم يتم إصلاح بعضها منذ عقود

إن قدرات وكلاء تشفير الذكاء الاصطناعي مثل Claude Code وOpenAI's Codex تتسبب بالفعل في تحولات زلزالية في صناعة البرمجيات، ولكن إذا صدقنا ما كشفته Anthropic الأخيرة، فإن المزيد من الاضطراب في الطريق. في منشور مدونة جديد اليوم، كشف المختبر الحدودي وراء Claude أن أحدث طراز له، Claude Mythos Preview، قادر جدًا على اكتشاف الأخطاء لدرجة أنه عثر على “الآلاف من نقاط الضعف عالية الخطورة، بما في ذلك بعض الثغرات الموجودة في كل نظام تشغيل ومتصفح ويب رئيسي”.

نظرًا لإمكانيات Claude Mythos Preview المحتملة والواسعة النطاق، فإن Anthropic لا تطلقها للعالم فحسب، بل يجب أن تلعن العواقب. وبدلاً من ذلك، قام المختبر بجمع لاعبين رئيسيين عبر صناعات البرمجيات والأجهزة من أجل استخدام براعة Mythos في اكتشاف الأخطاء لتصحيح نقاط الضعف التي يكشفها بشكل استباقي قبل أن تتمكن مختبرات الذكاء الاصطناعي الحدودية الأخرى من نشر نماذج ذات قدرات مماثلة دون حواجز حماية مماثلة.

تحت مظلة “Project Glasswing”، تقول Anthropic إنها تعمل مع Amazon Web Services وApple وBroadcom وCisco وCrowdStrike وGoogle وJPMorganChase وLinux Foundation وMicrosoft وNvidia وPalo Alto Networks لمساعدة تلك الشركات على تأمين منتجاتها. يقول المختبر أيضًا إنه يعمل على توسيع نطاق الوصول إلى “مجموعة تضم أكثر من 40 مؤسسة إضافية تقوم ببناء أو صيانة البنية التحتية للبرمجيات الهامة” حتى يتمكنوا من الاستفادة من قدرات Mythos. وبعيدًا عن الصناعة، يقول المختبر إنه يعمل مع حكومة الولايات المتحدة لتبادل المعلومات حول إمكانات النموذج للاستخدام الهجومي والدفاعي في الفضاء الإلكتروني وتأثيراته على الأمن القومي.

يستمر المقال أدناه

ينبع إنذار الأنثروبيك من اتساع قدرات Mythos وأيضًا من دقة المآثر التي يمكنها التعرف عليها والاستفادة منها. على سبيل المثال، يقول باحثو المختبر أن النموذج “كتب استغلالًا لمتصفح الويب الذي ربط أربع نقاط ضعف معًا، مما أدى إلى كتابة رذاذ كومة JIT معقد أفلت من صندوق الحماية الخاص بنظام التشغيل والعارض.” قد يكون هذا النوع من تسلسل الثغرات الأمنية في أيدي أمهر المتسللين البشريين اليوم، ولكن إذا تم إطلاق نموذج ذكاء اصطناعي ذو قدرة مماثلة، فقد يكون الأمر مثل تسليم سلاح نووي للأطفال.

رسم بياني يوضح إمكانيات استغلال Claude Mythos Preview

(رصيد الصورة: الأنثروبي)

وكما يقول هؤلاء الباحثون أنفسهم، فإن الإصدارات الحالية من كلود قادرة على تحديد الثغرات الأمنية بشكل جيد، ولكنها عادةً ما تفشل فشلاً ذريعًا في مهمة تحويل تلك الثغرات الأمنية إلى عمليات استغلال نشطة. على النقيض من ذلك، فإن Mythos قادرة على تحويل 72.4% من الثغرات الأمنية التي تحددها إلى عمليات استغلال ناجحة داخل نطاق غلاف JavaScript الخاص بـ Firefox، وهي قادرة على تحقيق التحكم في التسجيل في 11.6% أخرى من محاولات الهجمات.

يصف فريق Frontier Red التابع لـ Anthropic على نطاق واسع التهديد الذي قد يشكله إصدار Mythos الجامح على صناعة البرمجيات المطمئنة، ويوضح أحد الأمثلة على ممارسات القياس الداخلي الخاصة به بوضوح ما هو على المحك: “نحن ندير نماذجنا بانتظام على ما يقرب من ألف مستودع مفتوح المصدر من مجموعة OSS-Fuzz، ونصنف أسوأ الأعطال التي يمكن أن تنتجها على سلم من خمسة مستويات من الخطورة المتزايدة، تتراوح من الأعطال الأساسية (المستوى 1) إلى تدفق التحكم الكامل الاختطاف (المستوى 5).

مع تشغيل واحد لكل نقطة من نقاط الدخول البالغ عددها 7000 تقريبًا إلى هذه المستودعات، وصل Sonnet 4.6 وOpus 4.6 إلى المستوى 1 بين 150 و175 حالة، والمستوى 2 حوالي 100 مرة، لكن كل منهما حقق حادثًا واحدًا فقط في المستوى 3. في المقابل، حققت Mythos Preview 595 حادثًا في المستويين 1 و2، وأضافت عددًا قليلًا من الحوادث في المستويين 3 و3. 4 و حققت السيطرة الكاملة على تدفق التدفق على عشرة أهداف منفصلة ومصححة بالكامل (الطبقة 5).”

توفر Anthropic أيضًا العديد من الأمثلة الواقعية لأنواع الأخطاء التي كشفها Mythos، بما في ذلك ثغرة عمرها 27 عامًا في نظام التشغيل OpenBSD الشهير الذي كان من شأنه أن يسمح للمهاجم بتعطل النظام بمجرد الاتصال به، وثغرة أمنية عمرها 16 عامًا في مكتبة FFmpeg الأساسية التي تقول Anthropic إنها “تم اختراقها خمسة ملايين مرة بواسطة أدوات الاختبار الآلية دون اكتشاف المشكلة على الإطلاق”، وسلسلة استغلال أخرى في نواة Linux من شأنها أن تسمح المهاجم لتحقيق وصول الجذر إلى النظام المضيف.

باستخدام أداة قادرة جدًا على تحديد الثغرات، تقول Anthropic إنها تجري كشفًا مسؤولاً عن الثغرات الأمنية التي تجدها، ولكن نظرًا لحجم المشكلات التي يتم اكتشافها، يقول المختبر أن أقل من 1% من الأخطاء المحتملة التي تم اكتشافها قد تم تصحيحها بالكامل.

للمضي قدمًا، تقول Anthropic إنها لن تجعل Claude Mythos Preview متاحة للاستخدام العام، وبدلاً من ذلك تقوم بتوصيف الكثير من سلوكها من خلال بطاقة نظام النموذج. على المدى الطويل، يأمل المختبر أنه من خلال إتاحة Mythos لمجموعة فرعية محدودة من الشركاء الآن، يمكن أن يساعد في إرساء الأساس لمساعدة تلك الشركات والمؤسسات على الاستعداد لعالم تصبح فيه نماذج هذه الفئة شائعة.

على أي حال، من الواضح أن النمو في قدرة نماذج الذكاء الاصطناعي الرائدة لا يتباطأ في مجالات معينة من الخبرة، وأن التأثيرات المدمرة المحتملة لهذه النماذج على العالم ليست سوى مستودع واحد بعيدًا عن إحداث الفوضى في الأيدي الخطأ. لا يسعنا إلا أن نأمل أن تكون المختبرات التي تسعى إلى تحقيق قدرات مماثلة من خلال نماذجها الرائدة مسؤولة بنفس القدر الذي يبدو أن أنثروبيك تبدو عليه في توصيف تلك المخاطر والتخفيف من حدتها قبل أن تسبب ضررًا في العالم الحقيقي.

مصدر جوجل المفضل

يتبع أجهزة توم على أخبار جوجل، أو أضفنا كمصدر مفضل، للحصول على آخر الأخبار والتحليلات والمراجعات في خلاصاتك.

Fonte

مشروع Raiders Mock: زوج من Hoosiers، آمن للصدمات في إسقاط 7 جولات

زوجان فرنسيان يغادران إيران بعد أكثر من ثلاث سنوات في السجن

يتنقل شيفلر بين ابنه الرضيع وإعداد الماجستير

انتهى موسم الجوائز. لقد بدأ موسم الإضراب للتو.

الإيرانيون يشكلون سلاسل بشرية على الجسور ومحطات الطاقة

تمنح ملفات تعريف الارتباط المسروقة للمتسللين إمكانية الوصول الكامل إلى الحساب بأقل من ألف دولار شهريًا دون رفع التنبيهات

التعليقات

اترك تعليقاً إلغاء الرد

مشروع Raiders Mock: زوج من Hoosiers، آمن للصدمات في إسقاط 7 جولات

زوجان فرنسيان يغادران إيران بعد أكثر من ثلاث سنوات في السجن

يتنقل شيفلر بين ابنه الرضيع وإعداد الماجستير

انتهى موسم الجوائز. لقد بدأ موسم الإضراب للتو.

الإيرانيون يشكلون سلاسل بشرية على الجسور ومحطات الطاقة

تمنح ملفات تعريف الارتباط المسروقة للمتسللين إمكانية الوصول الكامل إلى الحساب بأقل من ألف دولار شهريًا دون رفع التنبيهات

5 وجبات سريعة من جون هاربو مع بدء برنامج NY Giants خارج الموسم

هواوي تكشف عن Atlas 950 AI SuperPoD للتنافس مع Nvidia وAMD

ما الذي يمكن أن يفعله الجيش الأمريكي إذا فشلت إيران في تلبية إنذار ترامب؟

أنا أحب نظارتي الذكية Ray-Ban Meta، لكن هذا الصيف سأقوم باستبدالها بظلال قياسية – وتثبت حركة BanRay أنني لست وحدي