
- غالبًا ما تفقد مقاطع الفيديو التي يتم إنشاؤها بواسطة الذكاء الاصطناعي تماسكها بمرور الوقت بسبب مشكلة تسمى الانجراف
- تعاني النماذج المدربة على البيانات المثالية عند التعامل مع مدخلات العالم الحقيقي غير الكاملة
- طور باحثو EPFL إعادة التدريب عن طريق إعادة تدوير الأخطاء للحد من التدهور التدريجي
غالبًا ما تفقد مقاطع الفيديو التي يتم إنشاؤها بواسطة الذكاء الاصطناعي تماسكها مع زيادة طول التسلسل، وهي مشكلة تُعرف باسم الانجراف.
تحدث هذه المشكلة لأنه يتم إنشاء كل إطار جديد استنادًا إلى الإطار السابق، لذلك يتم تضخيم أي خطأ صغير، مثل كائن مشوه أو وجه غير واضح قليلاً، بمرور الوقت.
تكافح النماذج اللغوية الكبيرة المدربة حصريًا على مجموعات البيانات المثالية للتعامل مع المدخلات غير الكاملة، ولهذا السبب عادةً ما تصبح مقاطع الفيديو غير واقعية بعد بضع ثوانٍ.
إعادة تدوير الأخطاء لتحسين أداء الذكاء الاصطناعي
يظل إنشاء مقاطع فيديو تحافظ على الاستمرارية المنطقية لفترات طويلة يمثل تحديًا كبيرًا في هذا المجال.
الآن، قدم الباحثون في مختبر الذكاء البصري للنقل (VITA) التابع لمدرسة EPFL طريقة تسمى إعادة التدريب عن طريق إعادة تدوير الأخطاء.
على عكس الأساليب التقليدية التي تحاول تجنب الأخطاء، فإن هذه الطريقة تغذي أخطاء الذكاء الاصطناعي عمدًا مرة أخرى في عملية التدريب.
ومن خلال القيام بذلك، يتعلم النموذج تصحيح الأخطاء في الإطارات المستقبلية، مما يحد من التدهور التدريجي للصور.
تتضمن العملية إنشاء مقطع فيديو، وتحديد التناقضات بين الإطارات المنتجة والإطارات المقصودة، وإعادة تدريب الذكاء الاصطناعي على هذه التناقضات لتحسين المخرجات المستقبلية.
تنتج أنظمة فيديو الذكاء الاصطناعي الحالية عادةً تسلسلات تظل واقعية لمدة تقل عن 30 ثانية قبل أن تتدهور الأشكال والألوان ومنطق الحركة.
من خلال دمج إعادة تدوير الأخطاء، أنتج فريق EPFL مقاطع فيديو تقاوم الانحراف على مدار فترات أطول، مما قد يؤدي إلى إزالة القيود الزمنية الصارمة على الفيديو المنتج.
يسمح هذا التقدم لأنظمة الذكاء الاصطناعي بإنشاء تسلسلات أكثر استقرارًا في تطبيقات مثل المحاكاة أو الرسوم المتحركة أو رواية القصص المرئية الآلية.
وعلى الرغم من أن هذا النهج يعالج الانجراف، فإنه لا يلغي جميع القيود التقنية.
تؤدي إعادة التدريب عن طريق إعادة تدوير الأخطاء إلى زيادة الطلب الحسابي وقد تتطلب مراقبة مستمرة لمنع الإفراط في التعامل مع أخطاء معينة.
قد يواجه النشر على نطاق واسع قيودًا على الموارد والكفاءة، فضلاً عن الحاجة إلى الحفاظ على الاتساق عبر محتوى الفيديو المتنوع.
لا يزال من غير المؤكد ما إذا كان تغذية الذكاء الاصطناعي بأخطائه فكرة جيدة حقًا، حيث يمكن أن تؤدي هذه الطريقة إلى تحيزات غير متوقعة أو تقلل من التعميم في السيناريوهات المعقدة.
يُظهر التطوير في VITA Lab أن الذكاء الاصطناعي يمكنه التعلم من أخطائه، مما قد يؤدي إلى تمديد الحدود الزمنية لتوليد الفيديو.
ومع ذلك، فإن كيفية إجراء هذه الطريقة للاختبارات الخاضعة للرقابة الخارجية أو في التطبيقات الإبداعية لا تزال غير واضحة، مما يوحي بالحذر قبل افتراض أنها يمكن أن تحل مشكلة الانجراف بشكل كامل.
عبر TechXplore
اتبع TechRadar على أخبار جوجل و أضفنا كمصدر مفضل للحصول على أخبار الخبراء والمراجعات والآراء في خلاصاتك. تأكد من النقر على زر المتابعة!
وبالطبع يمكنك أيضًا اتبع TechRadar على TikTok للحصول على الأخبار والمراجعات وفتح الصناديق في شكل فيديو، والحصول على تحديثات منتظمة منا على واتساب أيضاً.

التعليقات