استحوذ برنامج الدردشة الآلي المعروف باسم شات جي بي تي، الذي طورته شركة (OpenAI) على اهتمام الناس وتطلعاتهم. توجد بعض التطبيقات التكنولوجية المثيرة للإعجاب بسبب قدرتها على تلخيص الموضوعات المعقدة أو خوض محادثات طويلة.

ليس غريبًا أن تسارع شركات الذكاء الاصطناعي الأخرى لإصدار نماذج اللغات الكبيرة الخاصة بها، وهو اسم التكنولوجيا الأساسية الكامنة خلف برامج الدردشة مثل شات جي بي تي. إضافةً إلى دمج بعض نماذج اللغات في منتجات أخرى مثل محركات البحث.

قرر كاتب المقال «مايكل جي مادن» اختبار برنامج الدردشة الآلي على لعبة الكلمات المتقاطعة ووردل. كي تفوز باللعبة، عليك أن تحزر كلمة من خمسة أحرف في ست محاولات فقط، ويمكن أن تبدأ بكتابة كلمة عشوائية، حال كانت هذه الكلمة تتضمن حرفًا من أحرف الكلمة اللغز في موضعه الصحيح، تتلون خانة الحرف بالأخضر.

بعد اختبار أحدث جيل من برنامج الدردشة «شات جي بي تي 4» قال مايكل: «كان أداء البرنامج في هذه اللعبة ضعيفًا على عكس المتوقع، على هذا يجب تدريب برامج الدردشة على النص وإعطائهم معلومات حتى يتمكنوا من تحسين أدائهم».

تجدر الإشارة إلى أن شات جي بي تي 4 قد دُرب على 500 مليار كلمة تقريبًا، تتضمن ويكيبيديا وجميع الكتب العامة وأعدادًا ضخمة من المقالات العلمية ونصوص العديد من مواقع الويب. مع ذلك، يبين أداء البرنامج في اللعبة طريقة تمثيل نموذج اللغات الكبيرة للكلمات والتعامل معها، والقيود الناتجة عن ذلك.

كتب مايكل: «اختبرت شات جي بي تي 4 على ووردل، مع معرفة المواضع الصحيحة لحرفين في الكلمة». مثلًا النمط (#E#L#)، حيث يمثل الرمز (#) الأحرف المجهولة، والإجابة الصحيحة كلمة (mealy) أي «دقيق». وبالمثل مع كلمات أخرى. كانت النتيجة أن أعطى البرنامج إجابات خاطئة في خمسة من كل ستة أسئلة!

في محاولات أخرى، وجد روبوت المحادثة إجابات صحيحة بعد عدة محاولات، ووجد خمسة خيارات صحيحة مع النمط (##OS#). في حالة النمط (#R#F#)، اقترح الروبوت كلمتين من دون الحرف (F)، وكلمة (traff) وهي غير موجودة في القواميس أصلًا!

في تصميم شات جي بي تي، توجد شبكة عصبية عميقة، وهي وظيفة رياضية معقدة، أو قاعدة تحوّل المدخلات إلى مخرجات. توجد المدخلات والمخرجات في هذه الشبكة في صورة أرقام، ولأن المدخلات في هذه الحالة هي كلمات، تُترجم الكلمات إلى أرقام حتى تعمل الشبكة العصبية.

تُنفذ الترجمة باستخدام برنامج يحتفظ بقائمة ضخمة من الكلمات وتسلسل الحروف، ما يُسمى «الرموز المميزة».

تُحدد هذه الرموز بالأرقام، مثلًا كلمة «صديق» لها معرّف رمزي 6756، وتُقسم كلمة مثل «صداقة friendship» إلى رمزين: «صديق friend» و «سفينة ship». وتُمثل بالمعرفات 6756 و6729.

عندما يُدخل المستخدم سؤالًا، تُترجم الكلمات إلى أرقام قبل أن يبدأ شات جي بي تي 4 بمعالجة الطلب، لذلك لا تستطيع الشبكة العصبية العميقة فهم أحرف النصوص والكلمات.

يستطيع شات جي بي تي 4 التعامل مع الأحرف الأولى فقط من الكلمات. عندما طلب مايكل من البرنامج كتابة قصيدة فيها الحرف الأول لكل سطر من عبارة «أنا أحب الروبوتات»، كانت الاستجابة مدهشة، فيما يلي الأسطر الأولى:

«أنا مفتون بالتروس والحديد

حين تجري بتناسق فريد

باحثة عن علم أو اكتشاف جديد!».

تتضمن بيانات التدريب الخاصة بالروبوت أعدادًا ضخمة من الكتب المدرسية، التي تتضمن غالبًا مؤشرات أبجدية. لهذا قد يكفي جي بي تي 4 تعلم الارتباط بين الكلمات وحروفها الأولى.

عُدّل الرمز المميز للتعرف على طلبات من هذا النوع، عندما يُدخل المستخدمون طلباتهم، تُقسم العبارات إلى رموز فردية. مع ذلك، لم يستطع شات جي بي تي الاستجابة لطلبات التعامل مع الأحرف الأخيرة من الكلمات.

يُعد شات جي بي تي 4 سيئًا أيضًا في المتناظرات بالمفردات. طلب مايكل إنتاج عبارة متناظرة عن الروبوت، فاقترح كلمات غامضة لا تتناسب مع مفهوم التناظر، مثل «الروبوت السكير، أوروبا».

مع ذلك، تستطيع نماذج اللغات إنشاء برامج كمبيوتر أخرى، لأن بيانات التدريب الخاصة بها تتضمن العديد من مواقع الويب المخصصة للبرمجة. طلب مايكل من شات جي بي تي 4 كتابة برنامج لتحديد هوية الحروف المفقودة في اللعبة. البرنامج الأول كان به خطأ، وصححه عندما أشار مايكل إليه.

قال مايكل في هذا السياق: «عندما شغلت البرنامج، وجدت 48 كلمة صالحة تطابق النمط (#E#L#)، منها «يخبر» و«خلايا» و«مرحبًا». لكن عندما طلبت سابقًا اقتراح تطابقات لهذا النمط، وجدت واحدًا فقط».

تتضمن بيانات تدريب الروبوت تقريبًا كل كلمة متاحة، لذلك من الغريب أن نموذج لغة كبير مثل شات جي بي تي 4 لا يستطيع بسهولة حل ألغاز الكلمات البسيطة أو صياغة عبارات متناظرة.

نظرًا إلى أن الشبكة العصبية تعمل بالأرقام فقط، يجب تشفير جميع مدخلات النص، والعملية التي تقوم بذلك لا تتضمن الحروف.

توجد طريقتان للتغلب على هذه المشكلة في المستقبل. الأولى تعريف شات جي بي تي 4 بالحرف الأول من كل كلمة، لذلك يمكن زيادة بيانات التدريب الخاصة بها لتشمل تعيينات لموضع الحرف داخل كل كلمة في القاموس.

يتمثل الحل الثاني –الأشمل- في أن تنشئ نماذج اللغات الكبيرة المستقبلية رموزًا لحل مشكلات كهذه. تعرض ورقة بحثية جديدة استخدام نماذج اللغات أدوات خارجية لتنفيذ المهام، مثل العمليات الحسابية.

تجدر الإشارة إلى أننا ما زلنا في الأيام الأولى بالنسبة إلى هذه التقنيات، وما زال من الممكن أن تعالج هذه الحلول القيود الحالية لنحصل على تقنيات ذكاء اصطناعي أكثر إبهارًا.

اقرأ أيضًا:

هل سيبقى روبوت الذكاء الاصطناعي شات جي بي تي مجانيًا؟

منع تطبيق الذكاء الاصطناعي (chatGPT) من مشاركة الأبحاث والأوراق العلمية!

ترجمة: روان علي

تدقيق: فادي الخطيب

المصدر