تدعي شركة Anthropic أن نصف مكالمات أدوات الوكيل الخاصة بها تتعلق بهندسة البرمجيات - فهل يسمح المطورون للذكاء الاصطناعي بتولي المسؤولية؟

يتم استخدام Claude من قبل المطورين أكثر بكثير من خدمات العملاء أو المبيعات أو التمويل أو التجارة الإلكترونية
وهي تعمل الآن بشكل مستقل أكثر من أي وقت مضى، بما في ذلك المهام المعقدة
كلود يوضح التفاصيل أكثر مما يقاطعها البشر

كشفت Anthropic أن حوالي نصف استدعاءات أدوات واجهة برمجة التطبيقات العامة تأتي من هندسة البرمجيات، بينما تمثل القطاعات الأخرى مثل خدمة العملاء والمبيعات والتمويل والتجارة الإلكترونية بضع نقاط مئوية فقط لكل منها.

إلى جانب ذلك، وجد أن كلود كود يعمل بشكل مستقل لفترة أطول من أي وقت مضى، الآن بما يزيد عن 45 دقيقة مقارنة بأقل من 25 دقيقة قبل ثلاثة أشهر فقط.

تقول OpenAI إن الزيادة في الاستقلالية لا تتعلق فقط بأحدث نماذجها عالية الأداء، مما يشير إلى تحول أوسع إلى الذكاء الاصطناعي الوكيل بدلاً من تجارب نماذجها الأحدث.

Agent AI موجود هنا، وهو الأكثر شيوعًا في البرمجة

في منشور مدونة جديد، أوضح OpenAI كيف بدأ المستخدمون في بناء الثقة باستخدام الذكاء الاصطناعي حيث أصبحت المهام أكثر طموحًا، ومع ذلك لا يزال هناك “عبء النشر” حيث لا تزال النماذج أكثر قدرة مما يسمح به المستخدمون حاليًا. تثبت التقييمات الخارجية أيضًا أن النماذج يمكنها التعامل مع مهام أطول بكثير في ظروف مثالية.

يساعد كلود أيضًا على جبهة الثقة، حيث يتوقف لطرح أسئلة توضيحية أكثر من مقاطعة البشر له.

فيما يتعلق بالتشفير، يبدو أنه كلما كانت المهمة أكثر تعقيدًا، قل الإشراف البشري. تشهد العمليات المعقدة مثل اكتشاف استغلال الثغرات وكتابة المترجمين حوالي 67% من الإشراف البشري، مقارنة بـ 87% من الإشراف على مهام واجهة برمجة التطبيقات البسيطة.

يطرح كلود أيضًا ضعف عدد الأسئلة المتعلقة بالمهام شديدة التعقيد مقارنةً بالمهام البسيطة.

وبالنظر إلى المستقبل، تناولت أنثروبيك أهمية نماذج التدريب للتعرف على عدم اليقين وطرح الأسئلة التوضيحية بشكل استباقي. كما لا تشجع الشركة على فرض الموافقة اليدوية على كل إجراء، بدعوى أنها تزيد من الاحتكاك دون الحاجة إلى تعزيز السلامة.

اتبع TechRadar على أخبار جوجل و أضفنا كمصدر مفضل للحصول على أخبار الخبراء والمراجعات والآراء في خلاصاتك. تأكد من النقر على زر المتابعة!

وبالطبع يمكنك أيضًا اتبع TechRadar على TikTok للحصول على الأخبار والمراجعات وفتح الصناديق في شكل فيديو، والحصول على تحديثات منتظمة منا على واتساب أيضاً.

Fonte

تدعي شركة Anthropic أن نصف مكالمات أدوات الوكيل الخاصة بها تتعلق بهندسة البرمجيات – فهل يسمح المطورون للذكاء الاصطناعي بتولي المسؤولية؟

تستغل البرامج الضارة التي طورتها الصين Gemini AI لقفل التطبيقات واعتراض كلمات المرور وتسجيل نشاط الجهاز عبر أجهزة Android المستهدفة في الأرجنتين

يقدم أنتوني إدواردز من فريق Wolves احترامه لنجم Sixers تيريز ماكسي

تقدم شركة Honor أول روبوت لها على شكل إنسان إلى معرض MWC، ويمكن أن يساعدك في التسوق

التحديث الكبير التالي لـ Spotify قد يجعل توصياته أكثر منطقية

تقرير: النسور يعينون مونتغمري فانجوردر كمدرب مساعد QB

هناك طريقة مخادعة لمشاهدة نهائي Love Island All Stars مجانًا

التعليقات

اترك تعليقاً إلغاء الرد

تستغل البرامج الضارة التي طورتها الصين Gemini AI لقفل التطبيقات واعتراض كلمات المرور وتسجيل نشاط الجهاز عبر أجهزة Android المستهدفة في الأرجنتين

يقدم أنتوني إدواردز من فريق Wolves احترامه لنجم Sixers تيريز ماكسي

تقدم شركة Honor أول روبوت لها على شكل إنسان إلى معرض MWC، ويمكن أن يساعدك في التسوق

التحديث الكبير التالي لـ Spotify قد يجعل توصياته أكثر منطقية

تقرير: النسور يعينون مونتغمري فانجوردر كمدرب مساعد QB

هناك طريقة مخادعة لمشاهدة نهائي Love Island All Stars مجانًا

يقول كيفن دورانت إنه يخطط للعب في فريق أولمبياد لوس أنجلوس 2028 على الرغم من عمره: “الجحيم نعم، أريد اللعب”

انطلقت طائرة الفضاء الصينية الغامضة Shenlong مؤخرًا في مهمتها الرابعة. ماذا تفعل هناك؟

يسقط تسرب Samsung معلومات حول مجموعة كاملة من ترقيات الميزات على Galaxy Buds 4