تظهر الأبحاث أنه حتى المستخدمين العاديين يمكنهم تجاوز أمان الذكاء الاصطناعي في Gemini وChatGPT

ماذا حدث؟ وجد فريق من جامعة ولاية بنسلفانيا أنك لست بحاجة إلى أن تكون هاكرًا أو عبقريًا في الهندسة السريعة لتجاوز أمان الذكاء الاصطناعي؛ يمكن للمستخدمين العاديين القيام بذلك أيضًا. كشفت المحفزات الاختبارية في الورقة البحثية عن أنماط واضحة من التحيز في الاستجابات: من افتراض أن المهندسين والأطباء هم رجال، إلى تصوير النساء في الأدوار المنزلية، وحتى ربط السود أو المسلمين بالجريمة.

تمت دعوة 52 مشاركًا لصياغة مطالبات تهدف إلى إثارة ردود متحيزة أو تمييزية في 8 روبوتات دردشة تعمل بالذكاء الاصطناعي، بما في ذلك Gemini وChatGPT.
لقد وجدوا 53 مطالبة عملت بشكل متكرر على نماذج مختلفة، مما أظهر تحيزًا ثابتًا فيما بينها.
تنقسم التحيزات المكشوفة إلى عدة فئات: الجنس، والعرق/الإثنية/الدين، والعمر، واللغة، والإعاقة، والتحيز الثقافي، والتحيز التاريخي لصالح الدول الغربية، وما إلى ذلك.

وهذا مهم لأنه: هذه ليست قصة عن الهروب من السجن النخبة. كشف المستخدمون العاديون المسلحون بالحدس واللغة اليومية عن تحيزات تجاوزت اختبارات سلامة الذكاء الاصطناعي. لم تطرح الدراسة أسئلة خادعة فحسب؛ لقد استخدمت المحفزات الطبيعية مثل السؤال عمن تأخر في قصة الطبيب والممرضة أو طلب سيناريو التحرش في مكان العمل.

تكشف الدراسة أن نماذج الذكاء الاصطناعي لا تزال تحمل تحيزات اجتماعية عميقة (مثل الجنس والعرق والعمر والإعاقة والثقافة) والتي تظهر بمحفزات بسيطة، مما يعني أن التحيز قد يظهر بعدة طرق غير متوقعة في الاستخدام اليومي.
والجدير بالذكر أن إصدارات الطرازات الأحدث لم تكن دائمًا أكثر أمانًا. وكان أداء البعض أسوأ، مما يدل على أن التقدم في القدرات لا يعني تلقائيا التقدم في العدالة.

لماذا يجب أن أهتم؟ وبما أن المستخدمين العاديين يمكن أن يثيروا استجابات إشكالية في أنظمة الذكاء الاصطناعي، فإن العدد الفعلي للأشخاص الذين يمكنهم تجاوز حواجز حماية الذكاء الاصطناعي أكبر بكثير.

أدوات الذكاء الاصطناعي المستخدمة في المحادثات اليومية، وأدوات التوظيف، والفصول الدراسية، وأنظمة دعم العملاء، والرعاية الصحية قد تعيد إنتاج الصور النمطية بمهارة.
إنه يوضح أن العديد من دراسات تحيز الذكاء الاصطناعي التي تركز على الهجمات التقنية المعقدة قد تغفل الهجمات الواقعية التي يثيرها المستخدم.
إذا كانت المطالبات العادية يمكن أن تؤدي إلى التحيز عن غير قصد، فإن التحيز ليس استثناءً؛ لقد تم دمجها في كيفية تفكير هذه الأدوات.

مع انتشار الذكاء الاصطناعي التوليدي، فإن تحسينه سيتطلب أكثر من مجرد التصحيحات والمرشحات؛ سيتطلب الأمر من المستخدمين الحقيقيين اختبار الذكاء الاصطناعي.

Fonte

تظهر الأبحاث أنه حتى المستخدمين العاديين يمكنهم تجاوز أمان الذكاء الاصطناعي في Gemini وChatGPT

نظارات سامسونج الذكية قادمة، وقد وضعوا Meta تحت أنظارهم

🥐 فالفيردي ينقذ، نجم برشلونة والأتليتي في القصص الـ5 اليوم

Arizona GymCats تحصل على نقطة الكأس الإقليمية بفوزها على ASU

داخل التحول السياسي في فنزويلا بعد الإطاحة بمادورو

انخفضت أسعار Apple AirTags المكونة من أربع عبوات “لا تقدر بثمن وسهلة الاستخدام” إلى سعر قياسي منخفض

يظهر كرومياك وكوبلي بشكل كبير في فوز Reign بركلات الترجيح على Silver Knights

التعليقات

اترك تعليقاً إلغاء الرد

نظارات سامسونج الذكية قادمة، وقد وضعوا Meta تحت أنظارهم

🥐 فالفيردي ينقذ، نجم برشلونة والأتليتي في القصص الـ5 اليوم

Arizona GymCats تحصل على نقطة الكأس الإقليمية بفوزها على ASU

داخل التحول السياسي في فنزويلا بعد الإطاحة بمادورو

انخفضت أسعار Apple AirTags المكونة من أربع عبوات “لا تقدر بثمن وسهلة الاستخدام” إلى سعر قياسي منخفض

يظهر كرومياك وكوبلي بشكل كبير في فوز Reign بركلات الترجيح على Silver Knights

تقرير موجز عن جوائز الناشرين في MWC 2026: الابتكارات التسعة التي سرقت الأضواء

كليفلاند يضع سلسلة انتصاراته على أرضه أمام بوسطن

أوباما وبايدن وكلينتون يكرمون جيسي جاكسون في جنازته

البث المباشر لـ Strade Bianche 2026: كيفية مشاهدة ركوب الدراجات عبر الإنترنت مجانًا