جوجل تكشف عن VideoPoet نموذج الذكاء الاصطناعي لتوليد الفيديو
كشفت شركة جوجل عن نموذجها اللغوي الكبير الجديد لتوليد الفيديو المسمى VideoPoet، ويتميز هذا النموذج بقدرته على ترجمة المطالبات النصية إلى فيديو بدقة عالية، كما أنه قادر على توليد حركات كبيرة متماسكة دون عيوب.
VideoPoet يعالج تحديات توليد الحركات الكبيرة المتماسكة
تطورات الذكاء الاصطناعي في مجال توليد الفيديو
في السنوات الأخيرة، شهد مجال توليد الفيديو بالذكاء الاصطناعي تطورًا كبيرًا، وقد أدى ذلك إلى ظهور نماذج جديدة قادرة على توليد مقاطع فيديو أكثر واقعية وإمتاعًا.
ومع ذلك، لا تزال هناك بعض التحديات التي تواجه تقنيات توليد الفيديو الحالية. أحد هذه التحديات هو توليد الحركات الكبيرة المتماسكة.
VideoPoet يعالج التحدي
يعالج النموذج التحدي المتمثل في توليد الحركات الكبيرة المتماسكة من خلال إدماج القدرات المتعددة لتوليد الفيديو في إطار نموذجي لغوي كبير واحد.
ويستخدم النموذج طرقًا مختلفة، وهو مدرب باستخدام العديد من الرموز المميزة، مثل MAGVIT V2 للفيديو والصور، و SoundStream للصوت.
دقة النص وإثارة الحركة
يتميزالنموذج بقدراته المحسنة في دقة النص وإثارة الحركة.
فيما يتعلق بدقة النص، فإن النموذج قادر على ترجمة المطالبات النصية إلى فيديو بدقة عالية. على سبيل المثال، يمكن للنموذج إنشاء فيديو يصور مشهدًا واقعيًا بناءً على وصف نصي بسيط.
فيما يتعلق بإثارة الحركة، فإن النموذج قادر على توليد حركات كبيرة متماسكة وسلسة، على سبيل المثال، يمكن للنموذج إنشاء فيديو يصور مشهدًا حركة مثل معركة أو مطاردة دون أن يبدو غير طبيعي.
إمكانيات تطبيق VideoPoet
يمكن تطبيق نموذج VideoPoet في مجموعة متنوعة من المجالات، مثل الترفيه والتعليم والصناعة.
في مجال الترفيه، يمكن استخدام النموذج لإنشاء مقاطع فيديو رسوم متحركة وتأثيرات خاصة أكثر واقعية.
في مجال التعليم، يمكن استخدام النموذج لإنشاء مقاطع فيديو تعليمية أكثر تفاعلية وجاذبية.
وفي مجال الصناعة، يمكن استخدام النموذج لإنشاء مقاطع فيديو تروج للمنتجات أو الخدمات أو لتدريب الموظفين.
التأثير المحتمل لـ VideoPoet
يمكن أن يكون لنموذج VideoPoet تأثير كبير على صناعة الفيديو، من خلال معالجة التحدي المتمثل في توليد الحركات الكبيرة المتماسكة، يمكن للنموذج أن يساعد في إنشاء مقاطع فيديو أكثر واقعية وإمتاعًا.
يقدم نموذج VideoPoet تقدمًا كبيرًا في مجال توليد الفيديو بالذكاء الاصطناعي، من خلال قدراته المحسنة في دقة النص وإثارة الحركة، يمكن للنموذج أن يساعد في إنشاء مقاطع فيديو أكثر واقعية وإمتاعًا.
المصدر