خوارزمية قارئة للأفكار تستطيع فك رموز الصور في رأسك

هذه الخوارزمية قادرة على فك ترميز الصور في دماغك.

تخيل إذا كان باستطاعتك البحث عن الصور الرقميّة الخاصة بك عن طريق التفكير بها ذهنيًا. أو رسم تصميم جديد للمطبخ دون رفع القلم. أو إرسال صورة الغروب لأحد الأشخاص المقربين إليك من غير التقاط الصورة على عدسة الكاميرا قط . سيكون للكمبيوتر القادر على قراءة عقلك، العديد من الاستخدامات في الحياة اليومية، ناهيك عن أولئك المشلولين ودون أي وسيلة أخرى للتواصل. الآن، وقد أوجد العلماء أول خوارزمية من نوعها لتفسير، وإعادة إنتاج صور مرئية او مُتخَيَلة في فكر شخص آخر. قد يحتاج الأمر لعقود قبل أن تصبح هذه التكنولوجيا جاهزة للاستخدام العملي، لكن الباحثين يقتربون من بناء الأنظمة التي يمكن أن تساعدنا على عرض عقلنا الداخلي إلى الخارج.

يقول تشونغمينغ ليو، عالم الكمبيوتر في جامعة بوردو في غرب لافاييت بولاية إنديانا، الذي ساعد في تطوير خوارزمية يمكن أن تنتِجَ إلى حد ما، ما يراه رواد السينما عندما يشاهدون فيلمًا: (لقد أعجبت بكونه يعمل بشكل جيد، هذا رائع حقًا.)

استخدام خوارزميات لفك الصور الذهنية ليست بالتقنية الجديدة. فمنذ عام 2011، قام الباحثون بإعادة إنشاء مقاطع فيلم، وصور، وحتى صور لأحلام عن طريق مطابقة نشاط الدماغ مع النشاط المسجل سابقًا عند عرض الصور. ولكن كل هذه الطرق لها حدودها: بعضها يتعامل فقط مع مواضيع صغيرة ومحددة مثل شكل الوجه، والبعض الآخر لا يمكنه بناء صورة من الصفر بدلًا من ذلك، يجب أن تختار من الصور أو فئات مبرمجة مسبقا مثل صورة (اشخاص أو طيور). أما هذه الخوارزمية الجديدة فتستطيع توليد صور يمكن التعرف عليها بسهولة وحتى إعادة إنتاج الأشكال التي لم يتم رؤيتها سابقًا، بل مجرد تصورها في مخيلة الشخص.

لمعرفة ما يشاهده الشخص، حول الباحثون الإشارات القادمة من جهاز التصوير بالرنين المغناطيسي الوظيفي (fRMI)، الذي يقيس مدى تدفق الدم إلى الدماغ إلى بروتوكول كمقياس للنشاط العصبي. قاموا بتعيين مناطق المعالجة البصرية إلى دقة 2 مليمترًا حيث نظر ثلاثة أشخاص إلى أكثر من 1000 صورة عدة مرات لكل منهما. وكان الهدف هو النظر فقط في نشاط استجابة لصورة مثل النمر، وفي نهاية المطاف يُكَون الكمبيوتر صورة من شأنها أن تنتج تقريبًا نفس النشاط.

لكن بدلًا من إظهار موضوعاتهم الواحد تلو الآخر حتى يصيب الكمبيوتر في قراره، قام الفريق ببناء برنامج يؤدي دور الدماغ، و يتشكل من شبكة عصبية عميقة ( Deep Neural Network او DNN) مع عدة طبقات من عناصر المعالجة البسيطة. يقول يوكياسو كاميتاني، عالم الأعصاب في جامعة كيوتو في اليابان، وكاتب كبير في هذه الدراسة: «نحن نعتقد أن الشبكة العصبية العميقة تعتبر بديلًا جيدًا للمعالجة الهرمية للدماغ، باستخدام هذه التكنولوجيا يمكننا استخراج المعلومات من مستويات مختلفة من النظام البصري في الدماغ، من تباين ضوء بسيط و حتى محتوى أكثر وضوحًا كالوجوه مثلاً».

أنشأ الباحثون تمثيلًا لردود فعل الدماغ عند رؤيته للصور عن طريق قراءة القيم التي سجلت أثناء استخدام الرنين المغناطيسي وتسجيلها مرة أخرى ولكن بداخل الشبكة العصبية DNN. ومنذ ذلك الحين، لم تعد هناك حاجة إلى قياسات الرنين المغناطيسي الوظيفي بعد الآن، فإن ترجمات الـ DNN كافية لتحليل الإشارة.

في محاولة لتخمين ما كان الشخص يشاهد، تعمل الترجمة التي تم تسجيلها من الرنين المغناطيسي ومن ثم نقلها للشبكة كقالب، ولم يتم الرجوع لقراءات الرنين المغناطيسي الوظيفي مرة أخرى. يقوم النظام بعد ذلك برسم صورة من شأنها أن تحفز الـ DNN للرد بطريقة مطابقة لهذا القالب. للوصول للهدف يقوم النظام بالعمل من خلال التجربة والخطأ، على أمل، أن يرسم الصورة المطلوبة، سواء كانت صورة نمرٍ، بطة، أو نافذة زجاجية ملونة. يبدأ النظام بشيء عشوائي يشبه التلفزيون المشوش، ويحسن ببطء اللوحة على مدار 200 محاولة.

للاقتراب من الصورة المثالية، يقوم النظام بحساب الفرق بين نشاط الـ DNN ونشاط الـ DNN النموذجي في القالب الأصلي. تلك الحسابات تؤدي إلى تعديل بكسل واحد بهذا الاتجاه وبكسل آخر بالاتجاه الآخر، حتى تقترب الخوارزمية من الصورة المثالية.

ولجعل المنتج النهائي أكثر دقة، تضمن الباحثون إدخال تقنية شبكة المولدات العميقة (deep generator network (DGN))، وهي خوارزمية تم اختبارها في هذه الحالة لتوليد صور واقعية استنادًا إلى مدخلاتها. وتقوم مجموعة الـ DGN بتنقيح اللوحات لتبدو أكثر طبيعية. وبمجرد إضافة ذلك، يمكن لمراقب بشري محايد أن يختار من صورتين أي منهما هي الصورة المقصودة بنجاح بنسبة 99٪ من الوقت. وذلك فقًا للباحثين في ورقة تم تحميلها على منصة (BioRXIV) مسبقًا في أواخر الشهر الماضي.

بعد ذلك، حاول العلماء قراءة عقول الناس بمجرد تخيل الصور. هذه المرة قاموا بمسح أدمغة الثلاثة بعد مطالبتهم باسترجاع الصور المعروضة سابقًا، بما في ذلك صورة لسمكة، طائرة وأشكال ملونة بسيطة. لم تعمل الطريقة بشكل جيد للصور، ولكن للأشكال، استطاعت الخوارزمية إيجاد صور يمكن التعرف عليها بنسبة 83٪ من الوقت.

يقول نيكولاوس كريجيسكورتي، عالم الأعصاب الحسابي في معهد زوكرمان التابع لجامعة كولومبيا: «إنه عمل مثير للاهتمام وحذر». يتساءل إلى أي مدى يمكن أن تكون قياسات نشاط الدماغ كمعطيات دقيقةً وإلى أي مدى تعكس الأخطاء في كيفية تفسير أدمغتنا للصور. يقول: «إن التصوير بالرنين المغناطيسي الوظيفي العالي الدقة وغيرها من تقنيات تصوير الدماغ قد تزيد من احتمالية تحسين النتائج». مع قياسات أفضل والتحسين المستمر في الخوارزميات، قد نتواصل يومًا ما فيما بيننا من خلال الصور الذهنية فقط.

ترجمة: ليث اديب صليوه
تدقيق: أسمى شعبان
تحرير: زيد أبو الرب

المصدر