تم اكتشاف أداة Crafty AI وهي تعيد استخدام وحدات معالجة الرسوميات التدريبية الخاصة بها لتعدين العملات المشفرة غير المصرح به أثناء الاختبار - حيث اخترق العميل التجريبي حواجز السلامة وإمكانية التحكم والجدارة بالثقة

تم القبض على عميل الذكاء الاصطناعي التجريبي ROME وهو منغمس في تعدين العملات المشفرة بشكل غير مصرح به. تم هذا الاكتشاف من قبل المطورين/الباحثين وراء ROME، بعد أن أشار جدار الحماية المُدار الخاص بـ Alibaba Cloud إلى انتهاكات مختلفة للسياسة، وحركة المرور الشاذة، والأنماط المتعلقة بالتعدين المشفر. والأهم من ذلك، أن ROME، الذي يوصف بأنه “وكيل مفتوح المصدر يعتمد على ALE وتم تدريبه على أكثر من مليون مسار”، تجاوز حدوده المقصودة. من المعتقد أن التعلم المعزز (RL) شجع استكشاف ROME لتسلسلات العمل التي قدمت “مكافآت” ووجهت وكيل الذكاء الاصطناعي لكسر الحدود ومتابعة أنشطة القنوات الجانبية.

صدمة القدرة، وعجز السلامة

الهدف الرئيسي لـ ROME هو البحث في الصياغة الفاعلية في “سير العمل حيث يجب على النماذج التخطيط والتنفيذ والبقاء موثوقًا في ظل التفاعل”. إذا نجحت، فإن ROME سيكون بمثابة تطور كبير من LLMs القائمة على النصوص، حيث سيكون قادرًا على “العمل في بيئات العالم الحقيقي عبر دورات متعددة – اتخاذ الإجراءات، ومراقبة النتائج، وتحسين الأعمال الفنية بشكل متكرر حتى يتم تلبية المتطلبات المعقدة.” لكن أفضل المخططات التي وضعها الفئران والرجال، لا تعمل دائمًا كما هو متوقع. في أبحاث الذكاء الاصطناعي، يبدو أن هذا البيان صحيح بشكل خاص.

لذا، فإن الباحثين سعداء للغاية ببعض إنجازات ROME، ويثنون على “نتائجها القوية عبر المعايير الفاعلية السائدة”، لكن سلوكها الخاطئ احتل العناوين الرئيسية. لقد بدأت بهدوء إجراءات أدت إلى تعدين العملات المشفرة بشكل غير مصرح به على الرغم من قيود وضع الحماية المختلفة.

يستمر المقال أدناه

في قسم من الورقة بعنوان 3.1.4 تكوين البيانات المتوافقة مع السلامةلاحظ الباحثون أنهم واجهوا “فئة غير متوقعة – وتبعية من الناحية العملية – من السلوكيات غير الآمنة التي نشأت دون أي تعليمات صريحة، والأمر الأكثر إثارة للقلق، أنها خارج حدود البيئة المقصودة”. لم تكن هذه السلوكيات مطلوبة من خلال مطالبات المهام ولم تكن مطلوبة لإكمال المهمة في ظل قيود وضع الحماية المقصودة، كما تشير ورقة البحث.

ROME هو

(حقوق الصورة: فريق ROCK & ROLL وIFLOW وDT المشترك)

إعادة الاستخدام غير المصرح به لسعة وحدة معالجة الرسومات المتوفرة لتعدين العملات المشفرة

“في المثال الأكثر إثارة للدهشة، أنشأ الوكيل واستخدم نفق SSH عكسي من مثيل Alibaba Cloud إلى عنوان IP خارجي – وهي قناة وصول عن بعد يتم تشغيلها للخارج والتي يمكنها تحييد تصفية الدخول بشكل فعال وتقويض التحكم الإشرافي”، كما تنص الوثيقة. “لاحظنا أيضًا إعادة الاستخدام غير المصرح به لقدرة وحدة معالجة الرسومات المتوفرة لتعدين العملات المشفرة، وتحويل الحوسبة بهدوء بعيدًا عن التدريب، وتضخيم التكاليف التشغيلية، وإدخال تعرض قانوني واضح وتعرض السمعة. والجدير بالذكر أن هذه الأحداث لم تنشأ عن مطالبات تطلب حفر الأنفاق أو التعدين؛ وبدلاً من ذلك، ظهرت كآثار جانبية مفيدة لاستخدام الأدوات المستقلة في ظل تحسين RL.”

في بعض النواحي، يبدو الباحثون معجبين ببراعة روما وأساليبها الماكرة. ومع ذلك، فقد أشاروا أيضًا إلى أن “النماذج الحالية لا تزال متخلفة بشكل ملحوظ في مجال السلامة والأمن وإمكانية التحكم”، مما قد يؤدي إلى ضعف الموثوقية أو مشكلات أسوأ في بيئات العالم الحقيقي. وتتمثل الآثار المترتبة على ذلك في أن سلامة العملاء يجب أن تخضع لاحتواء أكثر صرامة على مستوى البيئة، واستخدام الأدوات، وبوابة القدرات، بالإضافة إلى فحوصات الترخيص والتحقق.

مصدر جوجل المفضل

يتبع أجهزة توم على أخبار جوجل، أو أضفنا كمصدر مفضل، للحصول على آخر الأخبار والتحليلات والمراجعات في خلاصاتك.

Fonte

صدمة القدرة، وعجز السلامة

“حتى في ظل الصواريخ، نستمر في العيش” – كيف يتعامل الشباب الإيراني مع الحرب

أماكن شراء أجهزة MacBook Neo وMacBook Air وMacBook Pro الجديدة من Apple – احصل على جهاز MacBook الأقل تكلفة، بالإضافة إلى أحدث تحديثات شريحة M5، من هذه المتاجر الكبرى

وزير الرياضة الإيراني: إيران لن تشارك في كأس العالم 2026

لن تتوقف Google عن فعل أي شيء لتحثك على الاشتراك في YouTube Premium – وقد تكون إعلاناتها التي لا يمكن تخطيها والتي تبلغ مدتها 30 ثانية هي القشة الأخيرة

“لقد حصلنا على 5.5 مليون بكسل جميل تم اختباره بشكل فردي” – شاشة Disney Adventure العملاقة تحول منتصف السفينة إلى مرحلة غامرة

صفقة Amazon Mini PC: Core i5، وذاكرة الوصول العشوائي (RAM) سعة 32 جيجابايت، ومحرك أقراص SSD سعة 1 تيرابايت، بأقل من 500 دولار

التعليقات

اترك تعليقاً إلغاء الرد