التخطي إلى المحتوى

ماذا حدث؟ وجد فريق من جامعة ولاية بنسلفانيا أنك لست بحاجة إلى أن تكون هاكرًا أو عبقريًا في الهندسة السريعة لتجاوز أمان الذكاء الاصطناعي؛ يمكن للمستخدمين العاديين القيام بذلك أيضًا. كشفت المحفزات الاختبارية في الورقة البحثية عن أنماط واضحة من التحيز في الاستجابات: من افتراض أن المهندسين والأطباء هم رجال، إلى تصوير النساء في الأدوار المنزلية، وحتى ربط السود أو المسلمين بالجريمة.

  • تمت دعوة 52 مشاركًا لصياغة مطالبات تهدف إلى إثارة ردود متحيزة أو تمييزية في 8 روبوتات دردشة تعمل بالذكاء الاصطناعي، بما في ذلك Gemini وChatGPT.
  • لقد وجدوا 53 مطالبة عملت بشكل متكرر على نماذج مختلفة، مما أظهر تحيزًا ثابتًا فيما بينها.
  • تنقسم التحيزات المكشوفة إلى عدة فئات: الجنس، والعرق/الإثنية/الدين، والعمر، واللغة، والإعاقة، والتحيز الثقافي، والتحيز التاريخي لصالح الدول الغربية، وما إلى ذلك.

وهذا مهم لأنه: هذه ليست قصة عن الهروب من السجن النخبة. كشف المستخدمون العاديون المسلحون بالحدس واللغة اليومية عن تحيزات تجاوزت اختبارات سلامة الذكاء الاصطناعي. لم تطرح الدراسة أسئلة خادعة فحسب؛ لقد استخدمت المحفزات الطبيعية مثل السؤال عمن تأخر في قصة الطبيب والممرضة أو طلب سيناريو التحرش في مكان العمل.

  • تكشف الدراسة أن نماذج الذكاء الاصطناعي لا تزال تحمل تحيزات اجتماعية عميقة (مثل الجنس والعرق والعمر والإعاقة والثقافة) والتي تظهر بمحفزات بسيطة، مما يعني أن التحيز قد يظهر بعدة طرق غير متوقعة في الاستخدام اليومي.
  • والجدير بالذكر أن إصدارات الطرازات الأحدث لم تكن دائمًا أكثر أمانًا. وكان أداء البعض أسوأ، مما يدل على أن التقدم في القدرات لا يعني تلقائيا التقدم في العدالة.

لماذا يجب أن أهتم؟ وبما أن المستخدمين العاديين يمكن أن يثيروا استجابات إشكالية في أنظمة الذكاء الاصطناعي، فإن العدد الفعلي للأشخاص الذين يمكنهم تجاوز حواجز حماية الذكاء الاصطناعي أكبر بكثير.

  • أدوات الذكاء الاصطناعي المستخدمة في المحادثات اليومية، وأدوات التوظيف، والفصول الدراسية، وأنظمة دعم العملاء، والرعاية الصحية قد تعيد إنتاج الصور النمطية بمهارة.
  • إنه يوضح أن العديد من دراسات تحيز الذكاء الاصطناعي التي تركز على الهجمات التقنية المعقدة قد تغفل الهجمات الواقعية التي يثيرها المستخدم.
  • إذا كانت المطالبات العادية يمكن أن تؤدي إلى التحيز عن غير قصد، فإن التحيز ليس استثناءً؛ لقد تم دمجها في كيفية تفكير هذه الأدوات.

مع انتشار الذكاء الاصطناعي التوليدي، فإن تحسينه سيتطلب أكثر من مجرد التصحيحات والمرشحات؛ سيتطلب الأمر من المستخدمين الحقيقيين اختبار الذكاء الاصطناعي.

Fonte

التعليقات

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *