تعد أنماط اللغة التقنية الهائلة والمعروفة أيضًّا باختصار (LLMS) خوارزميات تعلّم مُتقدّمة عميقة الإدراك، إذ تستطيع تحليل القضايا والتعامل مع الفكر البشري بعدة لغات، بواسطة توليده وصولًا إلى أجوبة ذات طابع بشري واقعي فعلي.

اكتسبت هذه الفئة الواعدة من نماذج محاكاة نمط المحادثة البشرية NLP شهرةً متزايدة بعد إطلاق منصة Open AI-ChatGPT، التي بدورها تستطيع أن تجيب وبسرعةٍ فائقة نطاقًا واسعًا من تساؤلات المستخدمين، بالإضافة إلى توليد نصوص كتابية مُقنعة لمختلف الاستخدامات.

مع تزايد انتشار هذه النماذج، فإن تقييم قدراتها وحدودها لأمرٌ في غاية الأهمية. قد تساعد هذه التقييمات والدراسات بشكل مبهر في عملية فهم المواقف التي يكون فيها نظام LLMs أقل أو أكثر أهمية، بالإضافة إلى تحديد الطرق المختلفة التي يمكن من خلالها تطويرها أيضًا.

نفذت الباحثة الأمريكية جوليان جو -من جامعة نيويورك- دراسةً هادفةً لتقييم أداء نظامين من أنظمة LLMS المُدرّبة للتعرّف على حس السخرية البشرية، بواسطة ذِكر عكس ما يحاول المرء قوله تمامًا، ونُشِرت النتائج التي توصلت إليها على موقع arXiv، ما ساعدها في تحديد وتصنيف ميزات الخوارزميات وعناصرها التي بوسعها تعزيز قدرة كل من خوادم الذكاء الاصطناعي والروبوتات على اكتشاف السخرية.

قالت الباحثة جو في ورقتها البحثية: «في مجال الفهم والتحليل العاطفي للعمليات المتعلّقة بلغة التواصل البشرية، فإن القدرة على تحديد السخرية والفكاهة بدقة أمرٌ ضروري حقًا لفهم المقاصد الحقيقية للناس».

أضافت جو: «نظرًا لأن استخدام السخرية غالبًا مايكون قائمًا على سياق الكلام، فإن البحث السابق قد اعتمد على أنماط تمثيل لغوية، مثل آلات ناقلات الدعم (SVM) والذاكرة الطويلة وقصيرة المدى (LSTM)، وذلك بهدف تحديد السخرية بمعلومات قائمة على سياق المحادثة، وأتاحت الابتكارات الحديثة في البرمجة اللغوية العصبية NLP المزيد من الإمكانيات لتحديد وفهم السخرية».

يعد فهم العواطف البشرية مجالًا بحثيًا هامًا، إذ يستلزم الأمر تحليل النصوص المنشورة على منصات التواصل الاجتماعي أو مواقع الويب الأخرى، وذلك بهدف الحصول على نظرة ثاقبة متعلّقة بمشاعر الناس حيال مواضيع أو منتَج معين، واليوم تستثمر العديد من الشركات في هذا النطاق، إذ إن ذلك يمنحها فرصةً لفهم كيفية تطوير أنظمتها وخدماتها وتلبية احتياجات عملائها.

يتوفّر اليوم العديد من نماذج البرمجة اللغوية العصبية NLP، التي بمقدورها معالجة النصوص والتنبؤ بنبرتها العاطفية الضمنية، أو بتعبير آخر؛ إذا كانت تعبر عن مشاعر إيجابية أو سلبية أو ربما عن مشاعر محايدة.

تحتوي العديد من المراجعات والتعليقات المنشورة على الإنترنت على السخرية والفكاهة، وبهذا تستطيع خداع النماذج لتصنيفها وفق المنحى الإيجابي مثلًا، في حين تعبّر في الواقع عن المشاعر السلبية، والعكس بالعكس.

مسبقًا، حاول بعض علماء الكمبيوتر بهذا الصدد تطوير الأنظمة القادرة على تحديد السخرية في النصوص المكتوبة. وقُدِّم نموذجان من أكثر النماذج الواعدة في هذا النطاق؛ هما CASCADE و RCNN-EoBERTa، وذلك في عام 2018 من قبل مجموعات بحثية متميّزة ومستقلة.

كتبت جو قائلة: «قدم جاكوب ديفلين وآخرون في 2018، في أثناء التدريب المسبق للمحولات العميقة ثنائية المنحى لفهم اللغة البشرية، نموذجًا جديدًا لتمثيل اللغة واستيعابها والتعامل معها، وأظهروا دقةً أعلى في تفسير اللغة السياقية. ويُعد CASCADE نموذجًا يحركه السياق ويخرج بنتائج جيدة للكشف عن السخرية.

تحلل هذه الدراسة مجموعة Reddit باستخدام هذين النموذجين المتطورين، وتُقيِّم أداءهما مقابل النماذج الأساسية للعثور على النهج المثالي للكشف عن السخرية.

أجرت جو سلسلةً من الاختبارات بهدف تقييم قدرة نموذج CASCADE وRCNN-RoBERTa على اكتشاف السخرية في التعليقات المنشورة على موقع Reddit، المنصة الشهيرة على الإنترنت التي تستخدم عادة لتقييم المحتوى ومناقشة مواضيع مختلفة.

قورِنت أيضًا قدرة هذين النموذجين على اكتشاف السخرية في عينات النصوص البسيطة، بمتوسط الأداء البشري في المهمة نفسها المذكورة في عمل سابق، وبأداء عدد قليل من النماذج الأساسية لتحليل النصوص.

اختتمت جو في ورقتها البحثية قائلةً: «ما توصلنا إليه هو أن المعلومات السياقية مثل تضمين شخصية المستخدم وفهمها بوسعه تحسين الأداء كثيرًا، بالإضافة إلى دمج محول RoBERTa، مقارنة بنهج CNN الأكثر تقليدية».

نظرًا لنجاح كل من النهج القائم على السياق وعلى المحولات، كما هو موضح في النتائج، فإن زيادة المحول بميزات معلومات سياقية إضافية قد يكون وسيلة للتجارب المستقبلية.

النتائج التي جُمعَت جزءًا من هذه الدراسة الأخيرة ربما توجه قريبًا المزيد من الدراسات في هذا المجال، ما يسهم في نهاية المطاف في تطوير LLMs الذي يعد الأفضل في اكتشاف السخرية والفكاهة في اللغة البشرية، وقد تثبت هذه النماذج في النهاية أنها أدوات قيمة للغاية لإجراء تحليلات المشاعر بسرعة، وذلك للمراجعات والمشاركات والمحتويات الأخرى التي ينشئها المستخدمون عبر الإنترنت.

اقرأ أيضًا:

الذكاء الاصطناعي يتخذ قرارات تتسم بالعنصرية والتحيز الجنسي في آخر الاختبارات

بعد أن طُلب منه إلقاء أكثر من ألف نكتة، شات جي بي تي يكرر 25 نكتة في الإجابة

ترجمة: زين العابدين بدور

تدقيق: نور حمود

المصدر