بالفيديو | الموناليزا تغني الراب... ولكن كيف ذلك؟

2024-04-25 2024-04-25T12:29:04Z
ندى ماهر عبدربه
ندى ماهر عبدربه
صانع مُحتوى

طقس العرب - طوّر فريق من العلماء في Microsoft Research Asia نموذجًا جديدًا للذكاء الاصطناعي يُسمى VASA-1، والذي يحوّل صور وجوه الأشخاص ومقاطع الصوت إلى فيديوهات متزامنة مع حركات الشفاه وتعابير الوجه وحركات الرأس بشكل دقيق وواقعي.

وفي ورقة بحثية، صرّح الفريق بأنهم قدموا إطار عمل VASA، الذي يتيح إنشاء وجوه ناطقة نابضة بالحياة مع مهارات عاطفية بصرية جذابة من خلال صورة واحدة ومقطع صوتي للكلام يتميز النموذج الأول، VASA-1، بقدرته على توليد حركات الشفاه بشكل رائع ومتزامن مع الصوت، بالإضافة إلى التقاط مجموعة واسعة من الفروق الدقيقة في تعابير الوجه وحركات الرأس الطبيعية التي تُسهم في إضفاء الأصالة والحيوية على الفيديو.

ويُدعي الفريق أن طريقتهم لا تُقدم فقط جودة عالية للفيديو مع ديناميكيات واقعية للوجه والرأس، ولكنها تدعم أيضًا إنشاء مقاطع فيديو بحجم 512 × 512 عبر الإنترنت بسرعة تصل إلى 40 إطارًا في الثانية مع زمن انتقال يكاد لا يُذكر.

 

بالفيديو | موظف طيران سعودي يتحول الى ترند... ما القصة؟

 

 

 

غناء الموناليزا ومخاوف من انتحال الشخصية

VASA، أو Visual Affective Skills Animator، هو الاسم الذي يعني "الرسوم المتحركة للمهارات البصرية العاطفية"، وهو قادر على خلق فيديوهات واقعية تحاكي سلوكيات المحادثة البشرية بدقة وواقعية.

يمكن لنموذج VASA إنشاء فيديوهات تبدو حقيقية تمامًا، حيث تعكس "الوجوه الناطقة الواقعية" سلوكيات المحادثة من خلال إيماءات الوجه وحركة العين والرأس بشكل طبيعي، وكل ذلك يبدأ من صورة ثابتة واحدة للرأس.

استخدم الفريق مجموعة بيانات VoxCeleb2 التي تتضمن مقاطع فيديو لآلاف المشاهير الواقعيين لتدريب نموذجهم.

وتميّز نموذجهم بقدرته على التعامل مع المدخلات المتنوعة خارج مجال التدريب، مثل الصور الفنية والكلام بغير الإنجليزية.

وبينما تثير قدرات النموذج مخاوف انتحال الشخصية، يؤكد العلماء أن هدفهم من الأداة هو تطوير المهارات العاطفية البصرية للشخصيات الافتراضية، وليس انتحال شخصية أي شخص في العالم الحقيقي.

تؤكد Microsoft أنه لا توجد خطط حاليًا لإصدار الكود الذي يدعم النموذج، وتهدف إلى استخدام التقنية بشكل مسؤول ووفقًا للوائح المناسبة في المستقبل.

 

 

اقرأ أيضا:

الصين تغرق في التراب... كيف ذلك؟

في اليوم العالمي للأرض أسئلة شائعة عنها...

 


المصادر:

Interesting Engineering

شاهد أيضاً
أخبار ذات صلة
لماذا تريد أمريكا حظر تطبيق تيك توك؟

لماذا تريد أمريكا حظر تطبيق تيك توك؟

السعودية الساعة 6:40 م | نشاط للسحب الركامية في أجزاء متفرقة من المملكة مرفوقة بأمطار متفاوتة الغزارة في هذه المناطق(تفاصيل)

السعودية الساعة 6:40 م | نشاط للسحب الركامية في أجزاء متفرقة من المملكة مرفوقة بأمطار متفاوتة الغزارة في هذه المناطق(تفاصيل)

الأردن | المنخفض جوي يبدأ مع ساعات فجر يوم غد الإثنين وهذه أهم التوصيات التي ينصح باتباعها أثناء تأثير الحالة الجوية(تفاصيل)

الأردن | المنخفض جوي يبدأ مع ساعات فجر يوم غد الإثنين وهذه أهم التوصيات التي ينصح باتباعها أثناء تأثير الحالة الجوية(تفاصيل)

الأردن | الجمعية الفلكية الأردنية: أقمار ستارلينك ظهرت في سماء الأردن مساء السبت

الأردن | الجمعية الفلكية الأردنية: أقمار ستارلينك ظهرت في سماء الأردن مساء السبت