ربما وجد فريق من الباحثين طريقة لتحسين روبوتات الدردشة الخاصة بنماذج اللغة الكبيرة LLM بما في ذلك تحسين دقة شات جي بي تي ChatGPT-4 بنسبة 21%. شرح الفريق كيف حققوا ذلك في مسودة جديدة، وذلك بالسماح لعملاء الذكاء الاصطناعي بالتفكير في أخطائه.

استخدم الفريق عملية تسمى Reflexion والتي (تزود العميل بذاكرة ديناميكية وقدرات التفكير الذاتي لتعزيز آثار تفكيره الحالي وقدراته على اختيار الإجراءات الخاصة بالمهام المحددة)، وفقًا لورقتهم.

وفقًا لما أوضحه الفريق على Substack فإن الذكاء البشري يتميز بقدرته على التعلم من الأخطاء، قد لا يمكن للبشر حل المعضلات من المحاولة الأولى، ولكن عند ارتكاب الأخطاء، تنتج أفكار جديدة عبر تحليل الخطوات الخاطئة.

واستنادًا على ذلك سمح الفريق لعملاء الذكاء الاصطناعي بتحليل أفعالهم وأخطائهم في البحث. تحدى الفريق عملاء الذكاء الاصطناعي لحل مشكلات مختلفة، من البرمجة إلى تجربة في AlfWorld وهو بيئة قائمة على النصوص تستخدم لتدريب واختبار عملاء الذكاء الاصطناعي. طُلب من العميل إكمال عدد من المهام، ولكن الطريقة الوحيدة للقيام بذلك كانت تعلم بيئته من طريق النصوص والحصول على مكافآت عند القيام بالملاحظات، مثل لعبة مغامرة النصوص.

في أثناء تشغيل العميل في AlfWorld بدون تقنية الانعكاس، تمكن من تحقيق دقة 63%. عندما مُنح العميل القدرة على التفكير الانعكاسي أي القدرة على التفكير في أفعاله وأخطائه، تمكن من تحقيق دقة 97% وحل 130 مهمة من أصل 134 مهمة.

في مهمة أخرى، طُلب من الذكاء الاصطناعي اللغوي العثور على إجابة لسؤال (من هو الممثل الذي اشتُهر بأدائه لدور ” Grown-Ups” في عرض ألو ألو؟). فبحث النموذج اللغوي أولًا عن عرض قائمة الممثلين، ومن ثم البحث عن (ألو ألو) لعمل تقاطع بين العرضين. ولكنه لم يحصل على القائمة التي يحتاج إليها، ففشل الذكاء الاصطناعي في حل المهمة.

يشرح الذكاء الاصطناعي عملية التفكير الانعكاسي: «لقد بحثت عن العرض الخطأ، كان يجب أن أبحث عن الشخصية الرئيسية للعرض، جوردن كاي، ومن ثم عُثر على الدور الذي كان مشهورًا به في العرض».

بعد تطبيق هذا النموذج في التفكير، مُنح الذكاء الاصطناعي نفس المهمة مرةً أخرى. ولكن هذه المرة، استطاع تطبيق ما تعلمه، وأنجز المهمة بأقل خطوات ممكنة، وحصل على الإجابة الصحيحة.

إن جميع عملاء الذكاء الاصطناعي قد شُغّلوا باستخدام شات جي بي تي، وفي التحديث الأخير، استخدم الفريق شات جي بي تي ChatGPT-3 و GPT-3.5 و عند استخدام التفكير الانعكاسي سجل الذكاء الاصطناعي دقة 88% في مهام الترميز، مقارنةً بنسبة 67% عندما تصرف شات جي بي تي ChatGPT-4 بمفرده.

أضاف الفريق على Substack: «لا يطور البشر دائمًا تقنيات جديدة لتحقيق معايير متقدمة باستخدام عمليات صنع القرار التي كان يعتقد في السابق أنها فريدة من الذكاء البشري، ولكن هذا بالضبط ما فعلناه».

تم نشر الورقة على arXiv.

اقرأ أيضًا:

هل يمكن مقاضاة الذكاء الاصطناعي؟ سنعرف الإجابة قريبًا

اختراع روبوتات دينية قامت بأداء طقوس هندوسية!

ترجمة: حمداش رانية

تدقيق: حسام التهامي

المصدر