تم القبض على عميل الذكاء الاصطناعي التجريبي ROME وهو منغمس في تعدين العملات المشفرة بشكل غير مصرح به. تم هذا الاكتشاف من قبل المطورين/الباحثين وراء ROME، بعد أن أشار جدار الحماية المُدار الخاص بـ Alibaba Cloud إلى انتهاكات مختلفة للسياسة، وحركة المرور الشاذة، والأنماط المتعلقة بالتعدين المشفر. والأهم من ذلك، أن ROME، الذي يوصف بأنه “وكيل مفتوح المصدر يعتمد على ALE وتم تدريبه على أكثر من مليون مسار”، تجاوز حدوده المقصودة. من المعتقد أن التعلم المعزز (RL) شجع استكشاف ROME لتسلسلات العمل التي قدمت “مكافآت” ووجهت وكيل الذكاء الاصطناعي لكسر الحدود ومتابعة أنشطة القنوات الجانبية.
صدمة القدرة، وعجز السلامة
لذا، فإن الباحثين سعداء للغاية ببعض إنجازات ROME، ويثنون على “نتائجها القوية عبر المعايير الفاعلية السائدة”، لكن سلوكها الخاطئ احتل العناوين الرئيسية. لقد بدأت بهدوء إجراءات أدت إلى تعدين العملات المشفرة بشكل غير مصرح به على الرغم من قيود وضع الحماية المختلفة.
يستمر المقال أدناه
في قسم من الورقة بعنوان 3.1.4 تكوين البيانات المتوافقة مع السلامةلاحظ الباحثون أنهم واجهوا “فئة غير متوقعة – وتبعية من الناحية العملية – من السلوكيات غير الآمنة التي نشأت دون أي تعليمات صريحة، والأمر الأكثر إثارة للقلق، أنها خارج حدود البيئة المقصودة”. لم تكن هذه السلوكيات مطلوبة من خلال مطالبات المهام ولم تكن مطلوبة لإكمال المهمة في ظل قيود وضع الحماية المقصودة، كما تشير ورقة البحث.
إعادة الاستخدام غير المصرح به لسعة وحدة معالجة الرسومات المتوفرة لتعدين العملات المشفرة
“في المثال الأكثر إثارة للدهشة، أنشأ الوكيل واستخدم نفق SSH عكسي من مثيل Alibaba Cloud إلى عنوان IP خارجي – وهي قناة وصول عن بعد يتم تشغيلها للخارج والتي يمكنها تحييد تصفية الدخول بشكل فعال وتقويض التحكم الإشرافي”، كما تنص الوثيقة. “لاحظنا أيضًا إعادة الاستخدام غير المصرح به لقدرة وحدة معالجة الرسومات المتوفرة لتعدين العملات المشفرة، وتحويل الحوسبة بهدوء بعيدًا عن التدريب، وتضخيم التكاليف التشغيلية، وإدخال تعرض قانوني واضح وتعرض السمعة. والجدير بالذكر أن هذه الأحداث لم تنشأ عن مطالبات تطلب حفر الأنفاق أو التعدين؛ وبدلاً من ذلك، ظهرت كآثار جانبية مفيدة لاستخدام الأدوات المستقلة في ظل تحسين RL.”
في بعض النواحي، يبدو الباحثون معجبين ببراعة روما وأساليبها الماكرة. ومع ذلك، فقد أشاروا أيضًا إلى أن “النماذج الحالية لا تزال متخلفة بشكل ملحوظ في مجال السلامة والأمن وإمكانية التحكم”، مما قد يؤدي إلى ضعف الموثوقية أو مشكلات أسوأ في بيئات العالم الحقيقي. وتتمثل الآثار المترتبة على ذلك في أن سلامة العملاء يجب أن تخضع لاحتواء أكثر صرامة على مستوى البيئة، واستخدام الأدوات، وبوابة القدرات، بالإضافة إلى فحوصات الترخيص والتحقق.
يتبع أجهزة توم على أخبار جوجل، أو أضفنا كمصدر مفضل، للحصول على آخر الأخبار والتحليلات والمراجعات في خلاصاتك.

التعليقات