فريق من رايس و بايلور يضع علامة جديدة في (التعلم العميق).
إتخذ خبراء علم الأعصاب والذكاء الإصطناعي من جامعة رايس (Rice) وكلية بايلور (Baylor) للطب من الدماغ البشري مُلهِماً لإبتكار طريقة تعلم عميق (Deep Learning) جديدة والتي تمّكن الحواسيب من التعلم عن العالم المرئي بنفسها في الغالب مثل أطفال البشر.
في التجارب ، أظهر نموذج الأداء العميق المختلط (Deep Rendering Mixture Model) قدرته على تعلم كيفية تمييز الأرقام المكتوبة بخط اليد باستخدام مجموعة بيانات مكونة من 10,000 رقم مكتوبة بواسطة موظفين فيدراليين وطلبة مدارس عليا (ثانوي) .
أزيح الستار هذا الشهر عن النتائج (تاريخ كتابة المقال 16 ديسمبر 2016) في مؤتمر نظم معالجة المعلومات العصبية (NIPS) المُنعقَد في برشلونة ، إسبانيا ، أوضح الباحثون كيفية تدريبهم لخوارزميتهم (Algorithm) بإعطائها 10 أمثلة صحيحة لأرقام من 0 إلي 9 ومن ثم إعطائها بضعة ألاف من الأمثلةوالتي عززت من تعليم تلك الخوارزمية لنفسها .
و أثبتت الخوارزمية أيضا دقتها في صحة تمييز الأرقام المكتوبة بخط اليد عن السابقات لها والتي تدربت أيضا علي آلاف الأمثلة الصحيحة على كل رقم .
»في الأسلوب التعبيري للتعلم المتعمق ، يستخدم نظامنا طريقة معروفة بالتعلم شبه الإشرافي،«يقول الباحث الرائد أنكيت باتل (Ankit Patel) ، أستاذ مساعد مع زمالة مشتركة في العلوم العصبية في كلية بايلور وهندسة الحاسوب والكهرباء في جامعة رايس.
«المجهودات الأعلي نجاحاً في هذا المجال كانت تستخدم تقنية تدعي بالتعلم الإشرافي ، عندما كانت تُدرَّبالآلة علي اآألاف من الأمثلة : هذا 1 وهذه 2.»
«البشر لا يتعلمون هكذا» يقول باتل . «عندما يتعلم الأطفال الرؤية في سنتهم الأولى ، فهم يستقبلون مدخلات ضئيلة حول ماهية الأشياء . يشير الأهل إلى بعض الأشياء مثل زجاجة ، كرسي ، ماما . لكن الطفل لايستطيع حتى فهم الكلمات المنطوقة في هذه المرحلة . إنه التعلم غالبا دون إشراف بواسطة بعض التفاعل مع العالم الخارجي .»
قال باتل أنه هو والطالب المتخرج تان إنجيوين (Tan Nguyen) ، مؤلف مساعد في الدراسة الجديدة ، وُضِعت لتصميم نظام تعلم شبه إشرافي للبيانات المرئية التي لاتحتاج الكثير من المجهودات البشرية في قالب الأمثلة التدريبية .
علي سبيل المثال ، الشبكات العصبية التي تستخدم التعلم الإشرافي تتطلب حرفيا إعطائها المئات وإن لم يكُن الألاف من الأمثلة التدريبية لأرقام مكتوبة بخط اليد قبل أن تتم تجربتها علي قاعدة البيانات ذات ال10,000 عدد المكتوبة في قاعدة بيانات المعهد الوطني المختلط للمعايير و التكنولوجيا (MNIST).
خوارزمية رايس – بايلور الشبه إشرافية (شبكة عصبية تلفيفية) ، هو برنامج عبارة عن طبقات من الخلايا العصبية الإصطناعية استلهم تصميمها من الخلايا العصبية الحيوية .
تلك الخلايا العصبية الاصطناعية ، أو وحدات المعالجة ، منظمة في طبقات ، والطبقة الأولي تمسح الصورة وتقوم بمهمات بسيطة مثل البحث عن الهوامش والتغييرات اللونية .
الطبقة الثانية تختبر المُخرَج من الطبقة الأولي وتبحث عن النماذج الأكثر تعقيدا . رياضياتيا ، تلك الطريقة المتداخلة الباحثة عن النماذج في غضون النماذج هي مؤشر لعملية غير خطّية .
«المهم هو قشرة دماغية مرئية بسيطة» باتل قائلاً عن الشبكات العصبية التلفيفية . «أعطِها صورة ، وكل طبقة تعالج الصورة أكثر رويدا رويدا وتفهمها بطريقة أعمق ، وبالوصول للأأخيرة ، تكون في عمق حقيقي وتتكون خلاصة فهم الصورة . كل سيارة مُقادة ذاتيا في هذه اللحظة لديها شبكات عصبية تلفيفية بداخلها لأنها حتى اآأن الأفضل للرؤية .»
مثل الأدمغة البشرية ، بدأت الشبكات العصبية كقوائم فارغة وأصبحت مُشكلة بالكامل بتفاعلها مع العالم . مثلا، كل وحدة مُعالَجة في الشبكة التلفيفية بدأت متساوية وتخصصت مع مرور الوقت علاوةً علي أنها مكشوفة إلي المُحفزات البصرية.
«الحواف مهمة جداً»، يقول إنجيوين . «الكثير من الخلايا العصبية للطبقات الدُنيّا تميل لأن تصبح كاشفات للحواف . ينظرون إلى المجسمات الأكثر إنتشارا والأكثر أهمية في الترجمة المرئية ، وكل واحدة تدرب نفسها لكي تُظهِر شكلاً مُعيناً ، مثل مُنتقِل من الأحمر إلي الأزرق بزاوية 45 درجة أو 30 درجة.
«عندما تلتقط تفاصيل الشكل ، تُصبِح مُشَوّشة ومن ثم تُمرر إلى الطبقة التالية ، والتي تبحث عن تكاوينها في أشكالها ، وهكذا ،» وقال أيضا «عدد المرات التي تقوم بتحولات لا خطّية هي أساسية في عمق الشبكة ، والعمق يحكم القوة. كلما إزداد عمق الشبكة ، كلما إزدادت الأشياء القابلة للتحرر. في الطبقات الأعمق ، تبدو الوحدات كأشياء ملخصة جدا كمُقل العيون ، مثل حواجز مشبكة عمودية الشكل أو حافلة مدرسة.»
إبتدأ إنجوين العمل مع باتل في يناير حيث إبتدأ الأخير فترته في المسار الأكاديمي في رايس وبايلور . لقد أمضى باتل أكثر من عقد من الزمان في دراسة وتطبيق تعلم الألة في الوظائف التي تمتد من تدريب السلع الرفيعة المستوي إلى الدفاع الصاروخي الإستراتيجي ، وهو قد أنفق أربعة أعوام في مهمة بحوث ما بعد الدكتوراة في معمل جامعة رايس .
ريتشارد بارانيك (Richard Baraniuk)، مؤلف مساعد آخر في الدراسة الجديدة. في أواخر 2015 ، بارانيك ، باتل وإنجيوين نشروا أول إطار نظري والذي يمكننا من إستمداد البنية الدقيقة للشبكات العصبية التلفيفية وتزويد الحلول المبدئية لتقلل من حدودها.
صرح بارانيك أن الفهم النظري القوي حيوي لتصميم الشبكات التلفيفية والتي تذهب إلي أبعد من حالة الفن الرائع اليوم .
«فهم صور الفيديو هو خير مثال ،» يقول بارانيك . «إذا نظرت إلي فيديو ، إطارٍ بإطار ، وأردت أن تفهم كل الأجسام وكيف تتحرك في كل إطار من الفيديو . لا يوجد شخص لديه كل هذا الوقت ، ومن أجل أن تفهم الآلة ما تراه في الفيديو ، عليها أن تفهم ماهية الأجسام ، مبدأ الفضاء ثلاثي الأبعاد (3D Space Concept) وأشياء أخرى كثيرة التعقيد . نحن كبشر نتعلم تلك الأشياء وحدنا ونستخف بها ، لكن هي الحلقة المفقودة في الشبكات العصبية الإصطناعية اليوم .
قال باتل نظرية الشبكات العصبية الاإصطناعية ، والتي تم تكريرها في ورقة نظم معالجة المعلومات العصبية ، قد تساعد علماء العصبيات جوهرياً في فهمأفضل لطبيعة عمل العقل البشري .
«ويبدو أن هناك بعض التشابه بين كيفية إظهار اللحاء البصري للعالم وكيف تستطيع تلافيف الشبكات أن تظهر العالم أيضا ، مع إختلافهم الكبير أيضا» يقول باتل «ما يفعله المخ يمكن أن يكون له صلة ، لكن يظل الإختلاف شديداً . والشيء الرئيسي الذي نعرفه عن المخ هو أنه في الأغلب يتعلم لا إشرافياً».
«ما أفعله أنا وزملائي علماء الأعصاب هو محاولة أن نعرف ، ماهي خوارزمية التعلم شبه الإشرافي المنفذة في الدوائر العصبية في اللحاء البصري ؟ وكيفية ارتباطها بنظريتنا في التعلم المتعمق ؟ » ويقول أيضاً. «هل يمكننا استخدام نظريتنا للمساعدة في توضيح ما يفعله المخ ؟ لأن طريقة عمل المخ قوية لمدى بعيد مقارنة بأي شبكة عصبية قد تم تصميمها.»
الترجمة: ماريو جورج سامي
التدقيق: أسامة القزقي.
المصدر