
- سيقوم وكلاء النماذج المتعددة بفحص بعضهم البعض قبل مشاركة البحث معك لضمان أقصى قدر من الجودة
- وضع الباحث مع Critique يمكّن من الحصول على درجات عالية في معيار DRACO
- Copilot Cowork موجود هنا لعملاء برنامج Frontier
أعلنت Microsoft عن خطط لترقية وكيل M365 Copilot Researcher الخاص بها مع التركيز بشكل واضح على استخدام نماذج متعددة عبر سير عمل الذكاء الاصطناعي للجمع بين قوة الأنظمة المختلفة.
وفي ظل هذا التحول بعيدًا عن الأنظمة ذات النموذج الواحد، سيتعاون العديد من وكلاء الذكاء الاصطناعي ويسلمون أجزاء مختلفة من المهمة لبعضهم البعض.
في البداية، سيستخدم وكيل الباحث نماذج GPT لإنشاء الاستجابة الأولية، مع تدخل كلود لمراجعتها للتأكد من دقتها واكتمالها وجودتها.
يستمر المقال أدناه
سيقوم وكيل M365 Copilot's Researcher بتمرير الردود من خلال وكلاء آخرين
وأوضح جاريد سباتارو، كبير مسؤولي التسويق في Microsoft AI في العمل، أن التحديث يتبع نجاح Anthropic's Claude Cowork، والذي تم دمجه منذ ذلك الحين في M365 Copilot. لقد تم الآن توفير Copilot Cowork، الذي يحمل اسمًا مناسبًا، في برنامج Frontier قبل طرحه على نطاق أوسع، مما يسمح للبشر بتفويض العمل إلى الذكاء الاصطناعي.
أوضح سباتارو كيف ينقل Copilot Cowork فائدة الذكاء الاصطناعي من المطالبات الأساسية الفردية إلى تنفيذ المهام الشاملة، وهو مثالي لسير العمل طويل الأمد ومتعدد الخطوات.
أما بالنسبة لوضع الباحث مع وظيفة النقد الجديدة المستندة إلى كلود، فقد تفوق بالفعل على أنظمة النموذج الفردي في الاختبارات المبكرة، حيث يضمن النموذج الثاني إخراجًا بأفضل جودة. لقد سجل أعلى بنسبة 13.8% وفقًا لمعيار DRACO (دقة البحث العميق والاكتمال والموضوعية)، الذي يعتبر معيار الصناعة.
حقق 57.4% بفضل الإعداد متعدد النماذج، وهو أكثر موثوقية من Deep Research مع نموذج o4-mini الخاص بـ OpenAI. كما أنها أفضل من Deep Research المستندة إلى o3، وGemini Deep Research، وClaude Opus 4.6، وPerplexity's Deep Research عند استخدام Opus 4.5 و4.6. ولم تقارنه Microsoft بالنماذج الرئيسية الأحدث مثل GPT-5.4، الذي يعمل بشكل فردي.
“عندما يتحرك الذكاء والثقة معًا، يتوقف الذكاء الاصطناعي عن كونه تجربة ويبدأ في أن يصبح وسيلة لإنجاز العمل”، كتب سباتارو، متحدثًا عن التقدم الذي أحرزته مايكروسوفت نحو الموجة 3 من M365 Copilot – وهو الذكاء الذي تحدده بأنه “فهم[ing] سياق العمل.”
اتبع TechRadar على أخبار جوجل و أضفنا كمصدر مفضل للحصول على أخبار الخبراء والمراجعات والآراء في خلاصاتك. تأكد من النقر على زر المتابعة!
وبالطبع يمكنك أيضًا اتبع TechRadar على TikTok للحصول على الأخبار والمراجعات وفتح الصناديق في شكل فيديو، والحصول على تحديثات منتظمة منا على واتساب أيضاً.

التعليقات