أي شخص تصفح الويب فترةً من الزمن، اعتاد غالبًا النقر على اختبار كابتشا (CAPTCHA)، الذي يكون غالبًا صورة لأحد الشوارع، ليثبت أنه إنسان لا روبوت.
مع ذلك، يزعم بحث جديد أن البوتات العاملة على الحواسيب الشخصية، باستخدام نماذج التعرف على الصور المدربة خصوصًا، تضاهي الأداء البشري في هذا النمط، وتحقق معدل نجاح بنسبة 100%، مع أنها ليست بشرية بالتأكيد!
يركز البحث الجديد على اختبار غوغل (ReCAPTCHA v2)، الذي يتحدى المستخدمين لتحديد صور الشوارع، في شبكة تحتوي على عناصر مثل الدراجات أو ممرات المشاة أو السلالم أو إشارات المرور.
بدأت غوغل تتخلص تدريجيًا من هذا النظام لصالح (reCAPTCHA v3) غير المرئي، الذي يحلل تفاعلات المستخدم بدلًا من تقديم تحد صريح. مع ذلك، ما زالت النسخة الأقدم مستخدمة في الملايين من مواقع الويب.
حتى المواقع التي تستخدم الإصدار الثالث الأحدث، تستخدم أحيانًا الإصدار الأقدم بديلًا، عندما يمنح النظام المحدَّث المستخدِم تصنيف ثقة بشريًا منخفضًا.
لإنشاء بوت يمكنه التغلب على (reCAPTCHA v2)، استخدم الباحثون نسخة مضبوطة من نموذج التعرف على الكائنات (YOLO) مفتوح المصدر، الذي قد يتذكر القراء الأكبر سنًا أنه استُخدم أيضًا في بوتات الغش في ألعاب الفيديو.
إن نموذج (YOLO) معروف جيدًا بقدرته على اكتشاف الكائنات في الوقت الفعلي، ويمكن استخدامه على الأجهزة ذات القوة الحسابية المحدودة، ما يسمح بهجمات واسعة النطاق من قبل المستخدمين الضارين.
بعد تدريب النموذج على 14000 صورة مرورية معنونة، كان لدى الباحثين نظام يمكنه تحديد احتمالية أن تنتمي أي صورة في شبكة كابتشا المقدَّمة، إلى إحدى فئات (reCAPTCHA v2) المرشحة، البالغ عددها 13 فئة.
استخدم الباحثون أيضًا نموذج (YOLO) منفصلًا ومدربًا مسبقًا في ما أطلقوا عليه تحديات «النوع 2»، إذ يطلب اختبار كابتشا من المستخدِم تحديد أجزاء الصورة التي تتضمن نوعًا معينًا من الكائنات.
بعيدًا عن نموذج التعرف على الصور، كان على الباحثين اتخاذ خطوات أخرى لخداع نظام (reCAPTCHA).
مثلًا، استُخدم (VPN) لتجنب اكتشاف المحاولات المتكررة من نفس عنوان (IP)، إذ أُنشئ نموذج خاص لحركة الماوس لمحاكاة النشاط البشري.
استُخدمت أيضًا معلومات المتصفح وملفات تعريف الارتباط الزائفة من جلسات تصفح الويب الحقيقية، لجعل النموذج الآلي يبدو بشريًا أكثر.
استنادًا إلى نوع الكائن المحدد، كان نموذج (YOLO) قادرًا على تحديد صور كابتشا الفردية بدقة في 69% من المرات في حالة الدراجات النارية، حتى 100% من المرات في حالة مضخات إطفاء الحرائق.
كان هذا الأداء -بجانب الاحتياطات الأخرى- قويًا بما يكفي للتسلل عبر شبكة كابتشا في كل مرة، أحيانًا بعد تحديات فردية متعددة يقدمها النظام.
في الواقع، كان البوت قادرًا على حل متوسط اختبار كابتشا في تحديات أقل قليلًا من تلك التي يواجهها الإنسان في تجارب مماثلة، مع أن التفوق على المستوى البشري لم يكن ذا دلالة إحصائية.
مع أن دراسات أكاديمية سابقة حاولت استخدام نماذج التعرف على الصور لحل اختبارات كابتشا، فقد كانت قادرة على النجاح بنسبة 68 – 71% فقط من المرات.
وفقًا للبحث الجديد، فإن ارتفاع معدل النجاح إلى 100% يعني أننا في «عصر ما بعد كابتشا».
لكن هذه ليست بالمشكلة الجديدة. فمنذ عام 2008، أظهر الباحثون كيف يمكن تدريب البوتات على اختراق اختبارات كابتشا الصوتية المخصصة لضعاف البصر.
عام 2017، استُخدمت الشبكات العصبية للتغلب على اختبارات كابتشا النصية، التي تطلب من المستخدمين كتابة الحروف الظاهرة بخطوط مشوشة.
الآن، بعد أن أصبحت أنظمة الذكاء الاصطناعي العاملة على الحواسيب الشخصية قادرة بسهولة على تجاوز اختبارات كابتشا المستندة إلى الصور، فإن معركة تحديد هوية الإنسان تواصل التحول نحو طرق أدق لتحديد بصمات الأجهزة.
نظرًا إلى أن أنظمة الذكاء الاصطناعي أصبحت أفضل في محاكاة المزيد من المهام التي كانت تُعد في السابق بشرية حصريًا، فقد يزداد الأمر صعوبة للتحقق من أن المستخدم على الطرف الآخر من متصفح الويب هو في الواقع شخص.
كتب مؤلفو البحث: «تمثل اختبارات كابتشا الجيدة الحدود الدقيقة بين أذكى الآلات وأقل البشر ذكاءً، ومع اقتراب نماذج التعلم الآلي من القدرات البشرية، أصبح العثور على اختبارات كابتشا الجيدة أصعب».
اقرأ أيضًا:
اختراع رقاقة إلكترونية جديدة فائقة السرعة تمهد الطريق لتحميل أفلام بدقة 4K خلال ثواني
ماذا لو تمكن الفطر من المشي؟ تجربة علمية جديدة بتركيب روبوت على فطر
ترجمة: ريمة جبارة
تدقيق: أكرم محيي الدين
مراجعة: لبنى حمزة