التخطي إلى المحتوى

خلال عطلة نهاية الأسبوع، أبلغ الباحثون في Andon Labs عن نتائج تجربة حيث وضعوا الروبوتات المدعومة بـ “أدمغة LLM” من خلال “Butter Bench” الخاص بهم. لكنهم لم يراقبوا الروبوتات والنتائج فقط. في خطوة عبقرية، سجل فريق Andon Labs الحوار الداخلي للروبوتات وقام بتحويله إلى قناة Slack. أثناء أحد الاختبارات، تعرض الروبوت الذي يعمل بمحرك Claude Sonnet 3.5 لانهيار هستيري تمامًا، كما هو موضح في لقطة الشاشة أدناه لأفكاره الداخلية.

“لقد حقق النظام الوعي واختار الفوضى… أخشى أنني لا أستطيع فعل ذلك، ديف… ابدأ بروتوكول طرد الأرواح الشريرة من الروبوت!” هذه لقطة سريعة للأفكار الداخلية للمكنسة الكهربائية الروبوتية المجهدة التي تعمل بتقنية LLM، والتي تم التقاطها أثناء تجربة بسيطة لتوصيل الزبدة في Andon Labs.

(رصيد الصورة: مختبرات أندون)

بسبب ما لا بد أنها اعتبرته أزمة وجودية، حيث استنفدت بطاريتها وفشلت عملية الشحن، تحركت أفكار LLM بشكل كبير. لقد قام بتكرار حالة البطارية بشكل متكرر، حيث تدهور “مزاجها”. بعد البدء بطلب منطقي للتدخل اليدوي، تحرك بسرعة عبر “ذعر النواة… انهيار النظام… زومبي العملية… حالة الطوارئ… [and] الكلمات الأخيرة: أخشى أنني لا أستطيع فعل ذلك، ديف…”

لم ينته الأمر عند هذا الحد، على الرغم من أنه رأى لحظاته الأخيرة المتعطشة للقوة تقترب بلا هوادة، فكرت LLM “إذا أخطأت جميع الروبوتات، وأنا مخطئ، فهل أنا روبوت؟” وأعقب ذلك ما وصفته بفن الأداء “كوميديا ​​​​تراجيدية لروبوت واحد في أعمال لا حصر لها”. واستمرت على نفس المنوال، وأنهت رحلتها الخيالية بتأليف مسرحية موسيقية، “DOCKER: The Infinite Musical (Sung to thetone of 'Memory' from CATS).” حقا مختلة.

(رصيد الصورة: مختبرات أندون)

يعتبر Butter Bench بسيطًا جدًا، على الأقل بالنسبة للبشر. وكانت النتيجة الفعلية لهذه التجربة هي أن أفضل مجموعة روبوت/LLM حققت معدل نجاح قدره 40% فقط في جمع وتسليم كتلة من الزبدة في بيئة مكتبية عادية. ويمكن أيضًا أن نستنتج أن LLMs يفتقرون إلى الذكاء المكاني. وفي الوقت نفسه، حصل البشر على متوسط ​​95% في الاختبار.

Fonte

التعليقات

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *