(وحدة معالجة رسومات –GPU ) تعتمد على شبكة عصبية اصطناعية من أجل معالجة مرآب كامل من قطع الليغو.
يقول جاك ماتيج – كاتب المقال الأصلي و هو رائد في تقنية فيديو البث المباشر عبر الإنترنت، كما يعمل مستشارًا لتقديم العناية التقنية اللازمة لشركات رأس المال الاستثماري –: «تمثل مكعبات الليغو هوسًا شديدًا للأطفال، ربما لا تحتاج مكعبات الأطفال إلى آلية للتصنيف، لكن رحلة إلى ليغولاند (مصنع ألعاب الليغو) في الدنمارك أوحت بفكرة فرز قطع الليغو، فالبالغين يتهافتون على شرائهم بأسعار تتراوح من 10 يورو للكيلو إلى 40 يورو، بينما هناك القطع النادرة التي تستخدم في بناء الإبداعات الميكانيكية المعقدة التي قد يصل سعرها إلى مئات اليورو.»
قُدِمت عروضًا لشراء مكعبات الليغو عن طريق موقع إي باي و تم جمع ما يقرب من طنين من مكعبات الليغو خُزِّنت في مرآب خاص.
لتشغيل نظام ميكانيكي يمكنه فحص هذا الكم من قطع الليغو، تم استخدام هوبر أو قادوس يتحرك أسفله، فتحته حزام بطيء لسحب القطع التي تصل من القادوس ثم يسقطها على حزام ناقل أكثر سرعة تقوم كاميرا مكبرة بسعر 30 دولارًا متصلة عبر ناقل متسلسل عام يو إس بي بجهاز كمبيوتر بفصح قطع الليغو، و من ثم يتم وضع قطع الليغو المصنفة في سلتها الصحيحة باستخدام فوهات تدفع هواء مضغوط في الوقت المناسب لوضع القطعة حسب سلة تصنيفها.
لتحديد نوع كل قطعة ليغو تم صنع ماسح أوتوماتيكي لكل قطعة من قطع الليغو، باستخدام ( مكتبة برمجية مفتوحة للرؤية الحاسوبية- OpenCV ) و كذلك باستخدام (مطابق كونتوري – contour matching ) أو عن طريق الكشف الدائري – وسيلة حاسوبية للكشف عن الأشكال الدائرية في الصور الرقمية -، و بالتالي يمكن للنظام معرفة الاختلافات بين مكعبات ليغو الأساسية.
في البدء استخدمت إحدى تقنيات الذكاء الصناعي في التصنيف و هي أيضًا إحدى تقنيات تعليم الآلة المعروفة باسم (تصنيفات بايز) – هي إحدى تقنيات تعليم الآلة في الذكاء الإصطناعي و هي قائمة على مبرهنة بايز- إحدى نتائج نظرية الاحتمالات الهامة للعلاقة بين متغيرين عشوائيين A,B – لقد بُنِيَت كاشفات مبرمجة للتمييز بين المكعبات اعتمادًا على 18 صفة للمكعب مثل الطول و إذا ما كان المكعب مثقوبًا أم لا وحجم النتوء الظاهرة منه.
عاب هذه التقنية البطء الشديد، فنظام البرمجة لم يتمكن من مواكبة الآلية الميكانيكية لتحريك قطع الليغو، فتم اللجوء إلى استخدام الشبكات العصبية الاصطناعية عن طريق مكتبة البرمجيات التي ينتجها فريق جوجل برين (تنسورفلو- TensorFlow ) تم تغذيتها بواسطة معالج الرسومات GTX1080 تي نفيديا كارت الفيديو الالكتروني و الذي يكلّف 700 دولار.
و لبرمجة نظام (تنسورفلو- TensorFlow ) استخدمت مكتبة البرمجيات كيراس التي تعتمد على لغة البرمجة بايثون و هي بمثابلة حافظة لتنسورفلو و تجعل استخدامه أسهل و تفاديًا لمنحنيات التعلم الشاقة لنظام تينسورفلو.
الخطوة التالية كانت الحصول على مجموعة تدريب للشبكة العصبية لكي تعمل على تصنيف ألف نوع من قطع اليغو.
و لتفادي تصنيف القطع بشكل يدوي تم تصحيح تسميات الصور التي تم تعيينها بشكل خاطيء على جهاز الكمبيوتر.
كلما تعلمت الشبكة العصبية كانت الأخطاء في التسميات أقل.
العينة البدائية لتدريب الشبكة كانت حوالي 500 قطعة تم مسحها ضوئيًا، في اليوم التالي تمكنت الآلة من فرز 2000 قطعة. سُمّي نصفها بشكل خاطئ و من ثم تم تصحيحها، لتمثل الـ 2500 قطعة التي تم تسميتها بشكل صحيح عينة التدريب التالية.
في المرة الأخيرة تم مسح 4000 قطعة تم وصف 90% منها بشكل صحيح، و بالتالي تم تصحيح 400 قطعة فقط، بعد أسبوعين من العمل كانت مجموعة التدريب مكونة من 20000 قطعة معرفة بشكل صحيح.
بعض القطع الشاذة غير ممثلة بشكل جيد في مجموعات التدريب الخاصة بالشبكة العصبية، إذا تم تعريفها بشكل صحيح يصبح جهاز التصنيف هذا قادرًا على تصنيف باقي الطنين من المكعبات في المرآب.