
- يتم استخدام Claude من قبل المطورين أكثر بكثير من خدمات العملاء أو المبيعات أو التمويل أو التجارة الإلكترونية
- وهي تعمل الآن بشكل مستقل أكثر من أي وقت مضى، بما في ذلك المهام المعقدة
- كلود يوضح التفاصيل أكثر مما يقاطعها البشر
كشفت Anthropic أن حوالي نصف استدعاءات أدوات واجهة برمجة التطبيقات العامة تأتي من هندسة البرمجيات، بينما تمثل القطاعات الأخرى مثل خدمة العملاء والمبيعات والتمويل والتجارة الإلكترونية بضع نقاط مئوية فقط لكل منها.
إلى جانب ذلك، وجد أن كلود كود يعمل بشكل مستقل لفترة أطول من أي وقت مضى، الآن بما يزيد عن 45 دقيقة مقارنة بأقل من 25 دقيقة قبل ثلاثة أشهر فقط.
تقول OpenAI إن الزيادة في الاستقلالية لا تتعلق فقط بأحدث نماذجها عالية الأداء، مما يشير إلى تحول أوسع إلى الذكاء الاصطناعي الوكيل بدلاً من تجارب نماذجها الأحدث.
Agent AI موجود هنا، وهو الأكثر شيوعًا في البرمجة
في منشور مدونة جديد، أوضح OpenAI كيف بدأ المستخدمون في بناء الثقة باستخدام الذكاء الاصطناعي حيث أصبحت المهام أكثر طموحًا، ومع ذلك لا يزال هناك “عبء النشر” حيث لا تزال النماذج أكثر قدرة مما يسمح به المستخدمون حاليًا. تثبت التقييمات الخارجية أيضًا أن النماذج يمكنها التعامل مع مهام أطول بكثير في ظروف مثالية.
يساعد كلود أيضًا على جبهة الثقة، حيث يتوقف لطرح أسئلة توضيحية أكثر من مقاطعة البشر له.
فيما يتعلق بالتشفير، يبدو أنه كلما كانت المهمة أكثر تعقيدًا، قل الإشراف البشري. تشهد العمليات المعقدة مثل اكتشاف استغلال الثغرات وكتابة المترجمين حوالي 67% من الإشراف البشري، مقارنة بـ 87% من الإشراف على مهام واجهة برمجة التطبيقات البسيطة.
يطرح كلود أيضًا ضعف عدد الأسئلة المتعلقة بالمهام شديدة التعقيد مقارنةً بالمهام البسيطة.
وبالنظر إلى المستقبل، تناولت أنثروبيك أهمية نماذج التدريب للتعرف على عدم اليقين وطرح الأسئلة التوضيحية بشكل استباقي. كما لا تشجع الشركة على فرض الموافقة اليدوية على كل إجراء، بدعوى أنها تزيد من الاحتكاك دون الحاجة إلى تعزيز السلامة.
اتبع TechRadar على أخبار جوجل و أضفنا كمصدر مفضل للحصول على أخبار الخبراء والمراجعات والآراء في خلاصاتك. تأكد من النقر على زر المتابعة!
وبالطبع يمكنك أيضًا اتبع TechRadar على TikTok للحصول على الأخبار والمراجعات وفتح الصناديق في شكل فيديو، والحصول على تحديثات منتظمة منا على واتساب أيضاً.

التعليقات