يستطيع أكثر البشر إنجاز أي مهمة فور مشاهدة شخص آخر يؤديها أمامهم مرةً واحدةً فقط. أما الروبوتات المبرمجة فتتعلم عبر تقليد البشر، وذلك بالتدرب على سلسلة من السلوكيات البشرية، قبل أن تتمكن من إعادة تجسيد هذا السلوك بفعالية.

تمكن الباحثون حديثًا من تعليم الروبوتات كيفية تنفيذ المهام، بجعلها تتابع محاكاة السلوك البشري لهذه المهام مرةً واحدةً فقط، باستخدام آليات التعلم الذاتي Meta learning، لكن هذه الآليات التعليمية تحتاج إلى بيانات حقيقية مكلفة، صعب تجميعها.

للتغلب على هذه التحدي، طور فريق من الباحثين في كلية Imperial College London أسلوبًا جديدًا يسمح بتطبيق المحاكاة التعليمية للروبوتات بنجاح من المحاولة الأولى، دون الحاجة إلى تجسيد بشري حقيقي للمهام، وذلك باستعمال خوارزميات تُعرف باسم شبكات التحكم بالمهام الضمنية task-embedded control networks (TecNets)، تسمح للروبوت بتعلم كيفية تنفيذ المهام عبر تطبيق المهمة مرةً واحدة أو عدة مرات، فضلًا عن بيانات التدريب المجهزة اصطناعيًّا.

كتب الباحثون في ورقتهم البحثية: «تكمنا باستعمال هذه الخوارزميات من التوصل إلى أسلوب معين للتحكم، عبر تضمين تجسيدات بشرية تضع سياسة تحكم، لتحقيق التعلم من مرة واحدة».

لا تحتاج هذه الطريقة التعليمية إلى تفاعل بشري فعلي مع الروبوتات في أثناء التدريب.

استخدم الباحثون مجموعة من البيانات في صورة فيديوهات تحاكي تجسيدات بشرية، نُفذت بواسطة PyRep (وهي مجموعة أدوات أُصدِرت مؤخرًا لتُستخدم في البحث العلمي في مجال الروبوتات)، للتخلي عن الحاجة إلى التجسيد البشري الفعلي في أثناء التدريب.

صنع الباحثون نموذجًا ثلاثي الأبعاد لذراع شبيهة بالذراع البشرية، مقسمة إلى أجزاء ليمكن استخدامها في محاكاة الحركة البشرية.

ثم صمموا البيانات في صورة مقاطع فيديو، تظهر فيها تلك الذراع المحاكية وهي تنفذ عددًا من المهام، واستعملوها لتدريب أنظمة الروبوتات.

وتعلم الروبوت كيفية إتمام المهمة فور تحليل مقاطع الفيديو، أو فور مشاهدة السلوك البشري المشابه مرةً واحدةً فقط.

شاهد الفيديو:

وأضاف الباحثون: «لا نستخدم ذراعًا بشرية حقيقية لتوفير تطبيقات بشرية خلال التدريب، بل نستخدم تأثير النطاق العشوائي leverage domain randomization بتطبيق إلكتروني لم يُشاهَد من قبل يسمى sim-to-real».

قيّم الفريق هذا النهج التعليمي الآني في المحاكاة وفي العالم الحقيقي، واستُخدم هذا التقييم لتدريب الروبوتات على إتمام مهام تتضمن تغيير أماكن الأشياء أو دفعها.

وحققت التقنية الجديدة، بدرجة مثيرة للإعجاب، نتائج مقاربة للنتائج التي حققتها مناهج المحاكاة التعليمية المعتمدة، مع أنها تضمنت تدريب الروبوت على مقاطع فيديو بدلًا من سلوكيات بشرية حقيقية.

أضاف الباحثون: «لقد تمكنت تقنيتنا البديلة من تحقيق أداء مشابه لتقنية state-of-the-art، المعتمدة على آلاف التطبيقات السلوكية المجمعة من الواقع، مع الحفاظ على فعاليتها مع التحولات المرئية، مثل الخلفيات المختلفة».

يمكن للنهج الذي طوره الفريق أن يتيح تطبيق التعليم المحاكي الآني، دون الحاجة إلى جمع كميات كبيرة من البيانات التطبيقية من أرض الواقع.

ستوفر هذه الطريقة الكثير من الجهد والموارد والوقت في محاولات تدريب الروبوتات باستخدام المحاكاة.

يخطط الباحثون الآن للبحث عن المزيد من السلوكيات التي يمكن تدريب الروبوتات عليها باستخدام هذه الطريقة.

وأضاف الباحثون: «نأمل في استكشاف المزيد من السلوكيات البشرية التي يمكن تحويلها من المحاكاة وتمثيلها واقعيًّا، مثلًا أظهرنا في هذا العمل أن حركة اليد البشرية يمكن محاكاتها، لكن هل يمكن تطبيق ذلك على جسم الإنسان كاملًا؟».

اقرأ أيضًا:

ما يعتقده الخبراء عن خطر انقراض البشر بسبب الذكاء الاصطناعي

الروبوتات الحيوية – كيف استطاع البشر محاكاة الطبيعة؟

ترجمة: رياض شهاب

تدقيق: نغم رابي

مراجعة: أكرم محيي الدين

المصدر