التخطي إلى المحتوى

تقوم Netflix بتفصيل أداة فيديو تعمل بالذكاء الاصطناعي تتجاوز مجرد التنظيف البسيط. يقوم نظامها، المسمى VOID، بقطع العناصر من اللقطات مع الحفاظ على كل شيء آخر يتصرف بطريقة لا تزال تبدو ثابتة.

يمثل هذا تحولًا في تحرير الفيديو بالذكاء الاصطناعي. يمكن للأدوات الموجودة أن تمحو العناصر غير المرغوب فيها، لكنها غالبًا ما تترك وراءها حركة تبدو معطلة، مثل الكائنات العائمة أو توقف الإجراءات دون سبب. يركز VOID على ما يحدث بعد التعديل، ويعيد بناء التسلسل بحيث تظل النتيجة تتبع السبب والنتيجة المعقولين.

يظهر البحث أن النموذج يمكنه ضبط التفاعلات استجابة للتغيرات، لذلك إذا تمت إزالة كائن داعم، فإن العناصر المتبقية تتفاعل بشكل طبيعي بدلاً من التجميد أو الخلل. فهو يعيد كتابة المنطق المادي لللقطة بشكل فعال ليتناسب مع الإعداد الجديد.

بالنسبة للمحررين والاستوديوهات، يشير ذلك إلى إصلاحات أكثر وضوحًا في مرحلة ما بعد الإنتاج دون كسر الانغماس، خاصة في اللقطات التي تتفاعل فيها عناصر متعددة.

كيف يعيد VOID كتابة اللقطة

يعامل VOID التعديلات على أنها تفاعلات متسلسلة. فهو يرسم ما يمكن أن يتأثر بمجرد إزالة شيء ما، ثم يعيد بناء التسلسل بحيث يظل الإجراء متتبعًا بشكل منطقي.

يبدأ النموذج بتحديد المناطق المتأثرة، بما في ذلك الأماكن التي قد تتغير فيها الظلال أو الاصطدامات أو الدعم. ثم يقوم ببناء خريطة منظمة لتلك التحولات ويولد نسخة جديدة من اللقطات التي تعكسها. يعمل تمرير التحسين الثاني على تسهيل الحركة ويمنع الكائنات من الالتواء أثناء اتباعها للمسارات المحدثة.

لماذا يهم التحرير المدرك للفيزياء

ما يبرز هو كيفية تعامل VOID مع السبب والنتيجة. تم تدريب النموذج على الآلاف من تسلسلات المحاكاة، مما يساعده على فهم كيفية استجابة الأشياء عندما تتغير الظروف.

في أحد الأمثلة، إزالة جزء من سلسلة الدومينو لا تؤدي إلى مسح البلاط فحسب، بل توقف التفاعل تمامًا لأنه لم يتبق شيء لدفع الحركة إلى الأمام. وفي حالة أخرى، لا تؤدي إزالة شخص يتفاعل مع الكائنات إلى تجميد اللقطة، ويستمر السلوك المتبقي كما هو متوقع.

يطبق VOID القواعد المستفادة حول السبب والنتيجة بدلاً من نسخ الأنماط من اللقطات السابقة.

ماذا تشاهد بعد ذلك

لا يزال VOID نظامًا بحثيًا، حيث تتم مشاركة التفاصيل في ورقة arXiv بدلاً من إصدار المنتج. لا يوجد جدول زمني حتى الآن للوقت الذي سيصل فيه هذا النوع من التحرير إلى أدوات المستهلك أو البرامج الاحترافية.

ومع ذلك فإن الاتجاه واضح. مع توسع مسارات عمل الفيديو بتقنية الذكاء الاصطناعي، ستصبح الأدوات التي تفهم التفاعلات المادية أكثر أهمية لعمليات التحرير عالية الجودة، خاصة في الأفلام والتلفزيون حيث تؤدي التناقضات الصغيرة إلى كسر الانغماس بسرعة.

والخطوة التالية هي التوسع في سيناريوهات أكثر تعقيدًا. يتضمن ذلك إعدادات أكثر كثافة، والمزيد من الكائنات، وتسلسلات أطول حيث تتداخل التفاعلات المتعددة. إذا استمر هذا التقدم، فإن التحرير المراعي للفيزياء يمكن أن يدفع أدوات الفيديو نحو إعادة بناء التسلسل الكامل الذي يخضع لمزيد من التدقيق.

Fonte

التعليقات

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *