تكنولوجيا ثورية من آبل Keyframer تحويل النصوص إلى صور متحركة!

أعلن الباحثون في آبل عن Keyframer، وهي نموذج أولي لأداة الرسوم المتحركة التي تستخدم الذكاء الاصطناعي والتي تمكن المستخدمين من إضافة حركة إلى الصور الثنائية الأبعاد عبر وصف كيفية تحريكها.

ذكرت الشركة في ورقة بحثية أن النماذج اللغوية الكبيرة لم تتم استكشافها بعد في الرسوم المتحركة، رغم أنها أظهرت إمكانات كبيرة في الوسائط الإبداعية الأخرى، مثل الكتابة وتوليد الصور.

تستفيد Keyframer من قوة النماذج اللغوية الكبيرة لتحريك الصور الثابتة باستخدام مطالبات باللغة الطبيعية.

تقدم آبل أداة Keyframer التي تعمل بالنماذج اللغوية الكبيرة كمثال واحد على كيفية استخدام هذه التكنولوجيا.

يمكن لـ Keyframer أن تأخذ ملفات بتنسيق SVG القابل لتغيير الحجم دون تغيير الجودة وتنشئ تعليمات برمجية بلغة CSS لتحريك الصورة بناءً على مطالبة نصية، وذلك باستخدام النموذج اللغوي الكبير GPT4 من OpenAI كنموذج أساسي.

يتطلب المستخدم تحميل الصورة، كتابة طلب نصي، ثم الضغط على زر “توليد”.

تشير الأمثلة في ورقة البحث إلى كيفية تحول صورة كوكب زحل بين ألوان الخلفية، أو عرض النجوم وهي تظهر وتختفي.

يمكن للمستخدمين إنشاء تصميمات الرسوم المتحركة المتعددة في وقت واحد، وتعديل الخصائص، مثل الألوان ومدة الرسوم المتحركة في نافذة منفصلة.

تعرف علي المزيد

لا يتطلب Keyframer خبرة في البرمجة، حيث يحول هذه التغييرات تلقائيًا إلى لغة البرمجة CSS، على الرغم من أن التعليمات البرمجية قابلة للتعديل بالكامل.

يعتبر هذا النهج القائم على الوصف بسيطًا مقارنةً بأشكال الرسوم المتحركة الأخرى التي يولدها الذكاء الاصطناعي، والتي تتطلب عادةً تطبيقات متعددة متنوعة وبعض الخبرة في البرمجة.

لا تتوفر Keyframer للجمهور بعد، وشملت دراسة المستخدم في ورقة بحث آبل 13 شخصًا فقط الذين يمكنهم استخدام صورتين SVG بسيطتين محددتين مسبقًا عند تجربة الأداة.

ذكرت آبل بعض القيود في الورقة، وأوضحت أن Keyframer تهتم بالرسوم المتحركة القائمة على الويب، مثل سلاسل التحميل، وعرض البيانات، والتحولات المتحركة.

بالمقابل، الرسوم المتحركة التي تراها في الأفلام وألعاب الفيديو معقدة جدًا ولا يمكن إنتاجها باستخدام الأوصاف فقط في الوقت الحالي.

تعتبر Keyframer واحدة من الابتكارات العديدة في مجال الذكاء الاصطناعي التي أعلنتها آبل في الأشهر الأخيرة.

أطلقت آبل في ديسمبر HUGS، وهي أداة تستطيع إنشاء صور رمزية بشرية جاهزة للرسوم المتحركة من مقاطع الفيديو.

أصدرت آبل في الأسبوع الماضي MGIE، وهو نموذج جديد للذكاء الاصطناعي يستطيع تحرير الصور باستخدام الأوصاف النصية.

المصدر

Similar Posts