يتيح تحديث تشات جي بي تي الأخير للمساعد الصوتي إمكانية الاستجابة للمدخلات النصية أو الصوتية أو البصرية في الزمن الحقيقي، سيُطرح روبوت الدردشة الجديد لمختبِري ألفا في الأسابيع القادمة تحت اسم ChatGPT-4o.

كشف المطورون أن النسخة الجديدة من تشات جي بي تي تستطيع قراءة تعابير الوجه ومحاكاة الأنماط الصوتية للبشر وإجراء محادثات في الزمن الحقيقي تقريبًا.

عرضت OpenAI الإصدار القادم من روبوت الدردشة الآلي للذكاء الاصطناعي (AI)، المسمى GPT-4o، في عرض تقديمي في الزمن الحقيقي يوم الإثنين (13 مايو 2024)، وبدا أن روبوت الدردشة الآلي، الذي تحدث بصوت عالٍ مع مقدمي العرض بواسطة الهاتف، يتقن المحادثة البشرية وإشاراتها العاطفية الخفية إذ كان يتنقل بين الأصوات الآلية والغنائية عند الأمر، ويتكيف مع المقاطعات ويعالج بصريًا تعابير الوجه والأجواء المحيطة بشركائه في المحادثة.

أظهر مساعد الذكاء الاصطناعي الصوتي مهاراته العالية في أثناء العرض التوضيحي بإتمام بعض المهام مثل الترجمة الفورية، وحل معادلة رياضية مكتوبة على قطعة من الورق، وإرشاد شخص كفيف في شوارع لندن.

كتب سام التمان، المدير التنفيذي لشركة OpenAI على موقع إكس في منشور من كلمة واحدة بعد إنتهاء العرض (Her)، مشيرًا إلى فيلم عام 2013 بنفس العنوان الذي يتحدث عن رجل وحيد يقع في حب مساعد ذكاء اصطناعي.

ولإظهار قدرته على قراءة الإشارات البصرية، استخدم روبوت الدردشة الآلي عدسة كاميرا الهاتف لقراءة تعابير وجه أحد مهندسي OpenAI ووصف مشاعره.
قال الروبوت، الذي أجاب باسم تشات جي بي تي: «آه، ها نحن ذا، يبدو أنك تشعر بالسعادة والبهجة مع ابتسامة عريضة ولمسة من الحماس … أيًا كان ما يحدث، يبدو أنك في مزاج جيد. أيمكنك مشاركة مصدر هذه المشاعر الطيبة؟».

اقرأ أيضًا:

عام مضى على تشات جي بي تي، فكيف أثرت ثورة الذكاء الاصطناعي على المجتمع؟

في أول خطوة كبيرة باتجاه الذكاء الاصطناعي العام، تشات جي بي تي يحصل على ذاكرة تحاكي ذاكرة الإنسان

ترجمة: إسراء أسعد

تدقيق: بشير حمّادة

مراجعة: محمد حسان عجك

المصدر