OpenAI تطلق GPT-4o تحديث جديد لنموذج شات جي بي تي
أقامت شركة OpenAI، الرائدة في مجال الذكاء الاصطناعي، حدثًا مباشرًا على الإنترنت في 13 مايو 2024 لاستعراض أبرز تحديثاتها الجديدة لنظام الذكاء الاصطناعي الشهير نموذج ChatGPT، خلال حدث Spring Updates. أعلنت الشركة عن نموذج جديد رائد للذكاء الاصطناعي، وهو نموذج GPT-4o، الذي يُعتبر أقوى تحديث لنموذج GPT حتى الآن!
OpenAI تكشف النقاب عن نموذج GPT-4o ثورة في الذكاء الاصطناعي متعدد الوسائط
يُقدم GPT-4o ميزات متقدمة وغير مسبوقة في مجال الذكاء الاصطناعي متعدد الوسائط، حيث استعرضت OpenAI بيانًا عمليًا يظهر القدرات الفائقة لهذا النموذج. بفضل هذا التحديث، يصبح ChatGPT قادرًا على رؤية وفهم الصور والفيديو، وسماع وفهم الأصوات، وقراءة النصوص، إضافة إلى ربط هذه الوسائط المختلفة في سياق واحد. الآن، يستطيع ChatGPT رؤية، وسماع، والتحدث!
أعلنت OpenAI عن تحديثات جذرية في سياستها تجاه النسخة المجانية من ChatGPT، حيث سيحصل مستخدمو النسخة المجانية أخيرًا على ميزات نموذج GPT-4. قررت الشركة إطلاق GPT-4o لكل من النسختين المجانية والمدفوعة. تُظهر هذه الخطوة التزام OpenAI بمبادئها التأسيسية غير الربحية، وسط الصراعات القضائية مع إيلون ماسك، الشريك المؤسس، الذي يلاحق الشركة قضائيًا بدعوى خرق اتفاق التأسيس والتحول نحو الربحية.
تهدف OpenAI بهذا التحديث إلى تحقيق الريادة في مجال الذكاء الاصطناعي متعدد الوسائط، لمنافسة نموذج Gemini من جوجل. رغم أن جيميناي مصمم ليكون متعدد الوسائط، إلا أن هذه القدرات ما زالت قيد التطوير. ولهذا، قد يصبح ChatGPT-4o النموذج الأول الذي يقدم خدمات الذكاء الاصطناعي متعدد الوسائط بشكل كامل!
في هذا المقال، نستعرض أبرز إعلانات OpenAI خلال الحدث المباشر الأخير، مع نظرة عامة على الخدمات الجديدة التي سيحصل عليها مستخدمو النسخة المجانية مقارنةً بالنسخة المدفوعة.
نموذج GPT-4o – أول نموذج يقدم قدرات تعدد الوسائط!
افتتحت OpenAI حدثها المنتظر بالحديث عن نموذج GPT-4o، حيث استعرضت القدرات الفائقة التي يمكن لهذا النموذج تقديمها، خاصة في مجال المحادثات الصوتية ومحادثات الفيديو. أصبح ChatGPT بهذا التحديث قادرًا على الرؤية والاستماع والتحدث.
مقالات ذات صلة:
- أفضل مميزات ChatGPT وكيفية استخدامها في عام 2024
- لماذا تختار روبوت Copilot بدلاً من ChatGPT؟
- ChatGPT أداة جديدة في ترسانة المتسللين؟
تحدثت OpenAI عن قدرات تعدد الوسائط التي تظهر في أبهى صورها خلال إدارة النموذج الجديد للمحادثات الصوتية. سابقًا، كانت المحادثات الصوتية تتم عبر ثلاث عمليات مختلفة، مما كان يتسبب في تأخير الاستجابة لمدة تتراوح بين 2 إلى 5 ثوانٍ في نماذج GPT السابقة. الآن، مع نموذج GPT-4o، يمكن فهم المحادثات الصوتية بشكل مباشر، حيث دُرّب النموذج على التعامل مع الوسائط المختلفة (صور، فيديو، صوتيات، نصوص) بالشبكة العصبية ذاتها!
تفوقت OpenAI على جوجل بإطلاق أول نموذج قادر على تقديم قدرات تعدد الوسائط بشكل كامل. في عرض لقدرات GPT-4o على رؤية وفهم محتويات الصور والربط بينها وبين النصوص في نفس السياق، أظهرت OpenAI اختبارًا بسيطًا لـ ChatGPT-4o يطلب من النموذج توليد رسم كاريكاتيري من صورة مرفقة مع أمر نصي يصف محتوى الرسم المطلوب. نجح النموذج في فهم قصد المستخدم وإنتاج كاريكاتير مطابق للوصف المطلوب.
استعرضت OpenAI قدرات النموذج الأخرى في فهم وإنتاج العديد من الصور، خاصة التي تحتوي على نصوص داخلها. كانت نماذج تحويل النصوص إلى صور تعاني من إضافة النصوص داخل الصور المولدة، ولكن GPT-4o يعمل على شبكة عصبية موحدة ومدربة على التعامل مع كافة الوسائط المختلفة من نصوص وصور وصوتيات وغيرها.
بفضل هذه القدرات، يستطيع النموذج إجراء محادثات فيديو مع المستخدمين، حيث يتمكن من قراءة وتحليل تعبيرات وجه المستخدم وفهم مشاعره عبر تحليل نبرة صوته والتفاعل معها صوتيًا خلال المحادثة.
ستُحدث هذه القدرات طفرة غير مسبوقة في مجال الترجمة الحية والمباشرة، حيث أكدت OpenAI على التزامها بدعم النموذج لأكبر عدد ممكن من اللغات واللهجات. حاليًا، يدعم ChatGPT أكثر من 50 لغة، وتأتي اللغة العربية على رأس هذه اللغات.
أداء النموذج في اختبارات التعددية الوسائط
خلال الحدث المباشر، استعرضت OpenAI أداء نموذج GPT-4o في عدد من اختبارات الأداء الشهيرة الموجهة لتقييم قدرات تعدد الوسائط. النتائج تُظهر أن GPT-4o هو أقوى نموذج ذكاء اصطناعي على مستوى العالم!
تطبيق ChatGPT يصل إلى أجهزة الكمبيوتر!
أعلنت OpenAI عن إطلاق تطبيق جديد لأجهزة الكمبيوتر، حيث ستبدأ بإطلاق النسخة الموجهة لأجهزة MacOS بدءًا من اليوم. تسعى الشركة لإطلاق التطبيق لأنظمة التشغيل الأخرى كالويندوز خلال الأسابيع القادمة، لكن ستبدأ حاليًا بإطلاقه على أجهزة الماك فقط. أكدت الشركة أن التطبيق سيعمل على النسختين المجانية والمدفوعة.
يعمل التطبيق كمساعد شخصي بالأوامر الصوتية من خلال الاختصارات السريعة على لوحة المفاتيح، وسيقدم قدرات فريدة عند إطلاق نموذج GPT-4o، مما يمكن المستخدمين من إجراء محادثات صوتية مباشرة مع مساعدهم الشخصي (ChatGPT) على الكمبيوتر للتفكير أو النقاش في حل المشكلات المختلفة التي تواجههم خلال العمل.
موعد إطلاق GPT-4o
تم اطلاق نموذج GPT-4o، لكنها كشفت أنها ستبدأ في إطلاقه في أقرب وقت خلال الأسابيع القادمة. وأعلنت الشركة أن GPT-4o سيقدم أداءً يصل إلى ضعف سرعة GPT-4 Turbo بنصف سعره فقط!
الخدمات المتاحة لمستخدمي النسخة المجانية
عند إطلاق GPT-4o، سيحصل مستخدمو النسخة المجانية على الخدمات التالية لأول مرة بشكل فوري:
- الوصول إلى أقوى قدرات الذكاء في ChatGPT من خلال نموذج GPT-4o
- الوصول إلى متجر بوتات الدردشة المخصصة (القائمة على نموذج GPT) من خلال متجر GPT Store
- استخدام قدرات تعدد الوسائط في فهم وتحليل الصور
- إمكانية استخدام النموذج في تلخيص المستندات النصية وتحليل البيانات الضخمة وإنشاء الرسوم البيانية
- تجربة خاصية الذاكرة الجديدة الموجودة في GPT-4 حاليًا، التي تجعل ChatGPT قادرًا على تمييز خصائص المستخدمين لتقديم تجربة استخدام مميزة ومخصصة لكل مستخدم
مع ذلك، لن يتمكن مستخدمو النسخة المجانية من تجربة الميزات الصوتية الجديدة في GPT-4o عند إطلاقه، حيث ستتاح هذه الميزات للمشتركين في الخطط المدفوعة أولاً. ولكن أكدت OpenAI أنها ستتيح لاحقًا جميع ميزات GPT-4o لمستخدمي النسخة المجانية، بما يتضمن القدرات الصوتية والمساعد الشخصي الصوتي.
اسئلة هامة
هل نموذج GPT-4o مجاني تمامًا؟
نعم، تخطط شركة OpenAI لجعل الروبوت الجديد مجانيًا بالكامل، مع البدء بإطلاق المزايا الصوتية للنسخة المدفوعة قبل إتاحتها للنسخة المجانية. ومن الجدير بالذكر أن النسخة المجانية ستحتوي على عدد محدود من الأسئلة اليومية مقارنةً بالخطط المدفوعة.
متى ستتوفر قدرات GPT-4 للنسخة المجانية؟
ستحصل النسخة المجانية على قدرات GPT-4 عند إطلاق الشركة لنموذج الجديد خلال الأسابيع القادمة، حيث سيعمل النموذج الجديد على النسختين المجانية والمدفوعة.
هل سيكون تطبيق ChatGPT متاحًا على نظام الويندوز؟
نعم، سيتم إطلاق تطبيق ChatGPT لنظام الويندوز خلال الأسابيع القادمة. ومع ذلك، بدأت الشركة اليوم بإطلاق التطبيق لنظام MacOS فقط.
هل يعتبر نموذج GPT-4o متعدد الوسائط بشكل كامل؟
نعم، سيوفر النموذج قدرات الذكاء الاصطناعي متعدد الوسائط فور إطلاقه، ليصبح أول نموذج يقدم هذه القدرات بشكل كامل ومتكامل.