جوجل تُطلق أداة Whisk لتوليد الصور بالذكاء الاصطناعي دون الحاجة للأوامر النصية
كشفت شركة جوجل مؤخرًا عن أداة جديدة تُدعى Whisk، والتي تُعد جزءًا من مجموعة أدواتها التجريبية. تتيح هذه الأداة للمستخدمين إمكانية إدخال الصور بدلاً من النصوص التفصيلية للحصول على صور مُعدلة أو “مُعاد تخيلها”، مما يُسهّل على المستخدمين تحويل الصور إلى نتائج إبداعية دون الحاجة إلى كتابة أوامر نصية معقدة.
توفر أداة Whisk للمستخدمين القدرة على إدخال صور متعددة لتحديد مختلف العناصر مثل الموضوع والنمط والمشهد. وتستفيد الأداة من نماذج الذكاء الاصطناعي Gemini لإنشاء نصوص وصفية خلفية يمكن استخدامها كمدخلات لنموذج جوجل لتوليد الصور، المعروف باسم Imagen 3. يعتمد نموذج Imagen 3 على تقنيات متطورة تُعزز القدرة على إنتاج صور دقيقة التفاصيل مع إضاءة غنية، وتُقلل التشوهات مقارنة بالإصدارات السابقة.
هدف أداة Whisk: “التقاط جوهر الموضوع” وليس إعادة إنشاء الصور الأصلية
ي منشورٍ رسمي على مدونتها، أوضحت جوجل أن الهدف من أداة Whisk ليس إعادة إنشاء النسخة الأصلية للصور، بل هو التركيز على “التقاط جوهر” الموضوع فقط. وأضافت جوجل أنه من الممكن أن تنتج الأداة صورًا قد تختلف عن التوقعات، حيث قد تظهر العناصر، وخاصة الأشخاص، بلون بشرة مختلف أو تسريحات شعر مغايرة، مما يعكس قدرة الأداة على الإبداع والابتكار.
إمكانية تعديل النصوص الخلفية لتحسين النتائج
تُتيح أداة Whisk للمستخدمين تعديل النصوص الخلفية لتصحيح العناصر المفقودة أو لتحسين النتائج التي قد تكون غير دقيقة. وأكدت جوجل في تصريحاتها أن “بعض العناصر قد تكون أساسية لمشروعك، وقد لا تتمكن Whisk من تحقيقها بدقة”، لذا توفر جوجل خيار تعديل النصوص الخلفية في أي وقت. هذه الميزة تجعل الأداة أكثر مرونة وإبداعية.
Whisk: أداة إبداعية لتوليد الصور بسرعة وبطريقة مبتكرة
رغم أن أداة Whisk لا تُعد أداة تعديل صور تقليدية، فقد وصفتها جوجل بأنها وسيلة إبداعية تساعد في استكشاف أفكار جديدة بطريقة سريعة ومبتكرة. وتوفر الأداة للمستخدمين خيار تنزيل الصور الناتجة، مما يتيح لهم استخدام المحتوى المُنتج بسهولة في مشاريعهم المختلفة.
إمكانية الوصول لأداة Whisk
حالياً، تُتاح أداة Whisk في نسختها التجريبية لمستخدمي المنصة التجريبية Google Labs في الولايات المتحدة. وتمنح هذه المنصة المستخدمين إمكانية الوصول إلى مزايا جوجل التجريبية في مجال الذكاء الاصطناعي، مما يُتيح لهم تجربة أحدث التقنيات المتوفرة في هذا المجال.