يستطيع الدماغ البشري التعرّف على وجه شخص مألوف أو سيارة قادمة بزمن قدره 100 ميلي ثانية. لا شك أن ردة فعل الروبوت أسرع، لكن السؤال الحقيقي عن مدى دقة هذه الاستجابة في الظروف الواقعية الواقعية؟
يمتاز الدماغ بقدرته الهامة على الاستفادة من المستقبلات الحسّية بأمثل طريقة بغية رفع مستوى الاستجابة، خصوصًا في حالات الكر أو الفر (المواجهة أو الهرب)، ولكن لا يسعنا قول المثل عن الروبوت، فيبدو أنّ الروبوت يفشل في محاكاة القدرة البصرية للإنسان، وهو أمر مقلق في وقتنا الحالي وفقًا لدراسة نُشرت في (JNeurosci) في مارس 2023.
هل يستطيع الروبوت التفاعل مع الخطر؟
سلطت الدراسة الضوء على قصور الشبكات العصبونية العميقة (DNNs) وعدم قدرتها على محاكاة الخلايا العصبونيّة للدماغ البشري. لكن مع ذلك ما زالت نماذج التعلم العميق تأخذ حيّزًا كبيرًا في علم الروبوت والكثير من تطبيقات الحياة الواقعية الذكيّة مثل: السيارات ذاتية القيادة.
تعرف الشبكات العصبونية العميقة أيضّا بشبكات التعلّم العميق، وهي فرع من فروع الذكاء الاصطناعي الذي يُستخدم لتعليم الروبوت كيفية تحليل البيانات المستقبَلة كالتعرّف على الوجوه أو السيارات. تستخدم تقنيات التعلم الآلي هذه العُقد المرتبطة داخليًا في هيكلية طبقية أشبه بما يحصل في الدماغ البشري.
ومع إن قدرة التعلّم العميق على المحاكاة كبيرة جدًا، فما يزال الروبوت قاصرًا فيما يتعلق بمحاكاة الحسابات البشرية، والأهم من ذلك محاكاة لطريقة الاتصال والارتباط بين الدماغ والجسد، وخاصة فيما يتعلق بالتعرّف البصري البشري.
تقول القائمة على الدراسة مارياك مور في بيان صحفي: «مع إن الشبكات العصبونية العميقة شهدت تطورًا هائلًا، فهي ما تزال بعيدة كل البعد عن إنشاء نموذج حسابي كامل للرؤية البشرية الحقيقيّة».
وقد فشلت عدة محاولات سابقة لمحاكاة الروبوت للرؤية البشرية، وحتى أن بعضًا من هذه الدراسات توصلت إلى استحالة محاكاة الرؤية البشرية.
وظّف الفريق البحثي تقنية طبيّة غير جراحية اسمها MEG أي التخطيط لمغناطيسية الدماغ التي تقيس الحقول المغناطيسية التي تولّدها التيارات الكهربائية في الدماغ البشري. فوجدت مور أنه بإمكان ديناميكيّة العصبونات البشرية التعرّف على تباينات الأجزاء المرئية بسهولة وتفسيرها أيضًا (كالعين أو العجلة أو الوجه) بعكس قدرة DNNs على ذلك.
تقول مور: «قد يزودنا هذا الاكتشاف بدلائل حول ماهية الشبكات العصبونيّة التي تعجز عن فهم الخصائص البصريّة للصور التي عادةً ما توصّف فئات الأشياء المرتبطة بيئيًا، كالوجوه والحيوانات … فقد يتحسن أداء DNNs المستخدمة في الروبوت لمحاكاة الدماغ البشري بإخضاعها لنظام تدريبي قاسٍ، يركّز أساسًا على الضغط السلوكي كما هو حال البشر في مراحل تطورهم».
من المهم جدًا قدرة الإنسان على تحديد اقتراب شيءٍ منه (ولو تقريبيًا)، وإن كان يقترب بالفعل فمن المهم أيضًا التنبؤ بخطواته التالية. فمن الممكن تعزيز فعالية التعلّم العميق لمحاكاة القدرات البشرية بدمج هذه الضغوطات في أثناء تدريب الشبكات العصبونية الاصطناعية.
ملخص الدراسة
تُعد الشبكات العصبونية العميقة نماذجًا واعدة فيما يخص محاكاة الحسابات التي تتم في قشرة الدماغ التي بدورها تدعم التعرّف البشري على الأشياء.
لكن مع إنها قادرة على تفسير جزء كبير من الاختلافات في البيانات العصبية، فالتوافق بين النماذج وديناميكيات الدماغ التي تمثلها ما زال قليلًا.
تطرح الدراسة سؤالًا عن الخصائص الأقل تمثيلًا بالنسبة لبيانات السلاسل الزمنية العصبيّة. فالميزات التمثيلية لا تُحسب حاليًا في بيانات السلاسل الزمنية العصبية، وتشير التقديرات إلى عدة مناطق من الدماغ حيث التيار البطني (ventral stream)، وذلك بالاعتماد على إعادة بناء الإشارات من البيانات المُستَخرجة من تخطيط مغناطيسية الدماغ للمشاركين (تسع إناث وستة ذكور) في أثناء تعريضهم لمشاهد بصرية مُحفّزة.
ركّز البحث على دراسة القدرة البصرية الدلّالية (visuo-semantic) للنماذج التي تتكون من توصيف (label) يولّده البشر لميزات الأغراض (features) وفئاتها (categories)، وذلك بهدف شرح التباينات صعبة التفسير على DNNs. إضافةً إلى ذلك، كُشف عن انعكاس تدريجي في الأهمية النسبية عند DNNs قياسًا بالواصفات البصرية الدلالية، إذ ينعزل تمثيل الأغراض عن الزمان والمكان في التيار البطني.
ومع إن المناطق البصرية المتعلقة بالمستوى الأدنى نالت تفسيرًا أفضل بالبدء الأسرع لميزات DNNs (نحو 66 ميلي ثانية بعد التحفيز)، فإن ديناميكية القشرة الدماغية للمستويات الأعلى المتمثلة بالميزات البصرية الدلالية تحفزت بوقت لاحق (عند 146 ميلي ثانية).
ومن بين كل الميّزات البصرية الدلالية، فإن DNNs حققت تميزًا فقط في أجزاء الغرض وفئاته الأساسية. إذ أظهرت النتائج أن المكوّن الأهم في التباينات، الذي لا تستطيع DNNs شرحه والمتعلق بديناميكة القشرة الدماغية للمستويات الأعلى، بالوسع بناؤه وتفسيره بنواحي الأغراض التي يسهل تسميتها.
ختامًا، لا بد من القول بإنّ DNNs تفشل تمامًا في التقاط التمثيلات الديناميكية للمستويات الأعلى للقشرة الدماغية البصرية البشرية، ويُنصح بالتوجه إلى البحث عن نماذج أكثر دقة لحسابات التيار البطني.
اقرأ أيضًا:
روبوت يطهو الطعام، ويتذوقه أيضًا!
هل يمكن للبشر التفاعل مع الروبوتات وتعليمها المهارات الاجتماعية؟
ترجمة: علي الذياب
تدقيق: دوري شديد
مراجعة: محمد حسان عجك