كان للتعلم العميق تأثير كبير في مختلف مجالات التكنولوجيا في السنوات القليلة الماضية، ويُعد مجال الرؤية الحاسوبي (أي قدرة الحاسوب على فهم الصور ومقاطع الفيديو تلقائيًا) من أهم الموضوعات التي كانت محط الاهتمام في هذا المجال، إذ تُعتَمد الرؤية الحاسوبية في العمل بتقنيات السيارات ذاتية القيادة، والقياسات الحيوية، والتعرف على الوجه. وتُعد معالجة الصور من أهم تطبيقات هذا العلم.
ما مفهوم الصورة؟
قبل أن ننتقل إلى معالجة الصور، نحتاج أولًا إلى فهم ماهية الصورة بالضبط، وممَا تتألف؟ تُمثل الصورة بأبعادها (الارتفاع والعرض) بناءً على عدد البكسلات.
فمثلًا إذا كانت أبعاد الصورة 500 × 400 (العرض × الارتفاع)، فإن العدد الإجمالي للبكسلات في الصورة هو 200000. والبكسل هو نقطة من الصورة لها ظل، وكثافة، ولون. وعادةً يُمثَّل البكسل بأحد الأشكال الآتية:
- تدرج الرمادي: يكون البكسل عددًا صحيحًا بقيمة تتراوح بين 0 أسود تام و255 أبيض تام.
- أحمر أخضر أزرق RGB: يتكون البكسل من 3 أعداد صحيحة بين 0 و 255، تمثل الأعداد الصحيحة كثافة الألوان الأحمر والأخضر والأزرق.
- أحمر أخضر أزرق مع حقل ألفا RGBA: نفس الألوان السابقة مع حقل مُضاف يُسمى ألفا يمثل شدة إضاءة الصورة.
تتطلب معالجة الصور مجموعة من العمليات المتسلسلة على كل بكسل من الصورة، والتسلسل هنا يعني العملية الأولى على كل بكسل من الصورة واحدًا تلو الآخر، وبعد الانتهاء منها بالكامل تبدأ العملية الثانية وهكذا حتى تنتهي كافة العمليات. بعد ذلك تُحسب قيمة مخرجات هذه العمليات لأي بكسل في الصورة.
ما معنى معالجة الصور؟
معالجة الصور هي عملية تحويل الصورة إلى شكل رقمي، وتنفيذ عمليات معينة للحصول على بعض المعلومات المفيدة منها. عادةً يتعامل نظام معالجة الصور مع جميع الصور على أنها إشارات ثنائية الأبعاد بتطبيق بعض طرق معالجة الإشارات المعروفة مسبقًا. وتوجد خمسة أنواع من معالجة الصور:
- التصوّر Visualization: البحث عن الأشياء غير المرئية في الصورة.
- التعرّف Recognition: تمييز الأشياء الموجودة في الصورة، واكتشافها.
- الوضوح والاستعادة Sharpening and restoring: إنشاء صورة محسّنة عن الصورة الأصلية.
- التعرف على الأنماط Pattern recognition: قياس الأنماط المختلفة للأشياء في الصورة.
- الاستعادة Retrieval: تصفح الصور، والبحث ضمن قاعدة بيانات كبيرة عن الصور الرقمية المشابهة للصورة الأصلية.
الخطوات الأساسية لمعالجة الصور
- الحصول على الصورة: الحصول على الصور هو الخطوة الأولى في معالجة الصور، وتُعرف هذه الخطوة أيضًا بالمرحلة البدائية في معالجة الصور. إذ تتضمن استرداد الصورة من مصدر ما، عادةً يكون مصدرًا فيزيائيًا.
- تحسين الصورة: هي عملية إبراز سمات معينة مهمة محجوبة في الصورة. قد يتضمن ذلك تغيير السطوع والتباين وما إلى ذلك.
- استعادة الصورة: عملية تحسين الشكل الذي تظهر عليه الصورة، وبعكس تحسين الصورة، تُستعاد الصورة باستخدام نماذج رياضية أو احتمالية معينة.
- معالجة ألوان الصورة: تتضمن معالجة الصور الملونة عددًا من تقنيات النمذجة الرقمية للألوان، وقد اكتسبت هذه الخطوة مكانةً بارزةً بسبب الاستخدام الكبير للصور الرقمية عبر الإنترنت.
- المعالجة متعددة الدقة: في هذه المرحلة تُمثَّل الصورة بدرجات مختلفة من الدقة، فتُقسَّم الصورة إلى موجات أو مناطق أصغر بهدف ضغط البيانات، ومن ثم تتمثل الصورة بهيئة هرمية بناءً على الدقة.
- الضغط: هو عملية تقليل حجم التخزين المطلوب لحفظ الصورة، ما يعني بالنتيجة تقليل حجم الحزمة المطلوب لنقلها أيضًا، وذلك مفيد جدًا خصوصًا عند الحاجة إلى إرسال الصورة عبر الإنترنت.
- المعالجة الشكلية للصورة: هي مجموعة من عمليات المعالجة لتحويل الصور بناءً على أشكالها.
- تجزئة الصورة: تقسيم الصورة هو من أصعب خطوات معالجة الصور فهو يتضمن تقسيم الصورة إلى الأجزاء أو الأغراض المكونة لها.
- التمثيل والوصف: بعد تقسيم الصورة إلى مناطق في عملية التجزئة، تُمثّل كل منطقة ووصفها بطريقة تلائم مع المعالجة الحاسوبية اللاحقة. ولتمثيل الصورة يجب التعامل مع خصائص كل جزء في الصورة، أمّا الوصف فينطوي على استخراج المعلومات الكمية التي تساعد على التمييز بين الأغراض.
- التعرُّف: في هذه المرحلة يُسمّى كل غرض بناءً على وصفه.
أهم تطبيقات معالجة الصور:
استعادة الصور الطبية
تُستخدم تقنيات معالجة الصور على نطاق واسع في الأبحاث الطبية، ما ساعد على وضع خطط علاجية أكثر كفاءةً ودقةً. فتُستخدم معالجة الصور مثلًا للكشف المبكر عن سرطان الثدي، وذلك باستخدام خوارزمية متطورة تكشف عن الكتل السرطانية في فحوصات الثدي. ونظرًا لأن الاستخدام الطبي يستدعي معالجي صور مدربين تدريباً عالياً، فإن هذه التطبيقات تتطلب اختبارًا وتقييمًا كبيرًا قبل أن يُسمح باستخدامها.
مراقبة حركة المرور:
يُستخدم هنا نظام معالجة صور الفيديو VIPS، ويتكون من:
- نظام التقاط الصور.
- نظام الاتصالات.
- نظام معالجة الصور.
عند التقاط الفيديو، يكون لدى النظام عدد من المناطق المحددة التي تُسمى مناطق الفحص، فعندما تدخل سيارة إلى هذه المنطقة يولّد النظام إشارة (تشغيل – ON)، وإشارة (إيقاف – OFF) عندما تخرج السيارة منها، وبالوسع إعداد مناطق الفحص هذه لمسارات متعددة، أو استخدامها لمراقبة حركة المرور في محطة معينة.
بالإضافة إلى ذلك يمكن تسجيل رقم لوحة السيارة أوتوماتيكيًا، وتمييز نوع السيارة، ومراقبة سرعة السائق على الطريق السريع وغير ذلك الكثير.
إعادة بناء الصورة
من الممكن استخدام معالجة الصور لاستعادة الأجزاء المفقودة التالفة من الصورة منها وتعبئتها، وذلك باستخدام أنظمة معالجة الصور التي تتدرب بكثافة باستخدام قواعد بيانات من الصور الحالية لإنشاء إصدارات أحدث من الصور القديمة والتالفة.
الكشف عن الوجه
أحد أكثر تطبيقات معالجة الصور شيوعًا التي نستخدمها اليوم هو اكتشاف الوجه. نستخدم هنا خوارزميات التعلم العميق لتدريب الآلة بدايةً على السمات المحددة للوجوه البشرية، مثل شكل الوجه، والمسافة بين العينين وما إلى ذلك. وبعد تعليم الآلة ميزات الوجه البشري، ستبدأ بفحص جميع الأجزاء في الصورة التي تشكل وجهًا بشريًا. يعد اكتشاف الوجه أداةً حيويةً تُستخدم في السياسات الأمنية، والقياسات الحيوية، وحتى الفلاتر المتوفرة في معظم تطبيقات الوسائط الاجتماعية هذه الأيام.
فوائد معالجة الصور
كان لتطبيقات تقنيات معالجة الصور تأثير هائل في الكثير من المؤسسات التقنية، وفيما يلي بعض أهم الفوائد لمعالجة الصور، بغض النظر عن مجال التشغيل:
- إمكانية توفير الصورة الرقمية بالتنسيق الذي تريده (صورة محسنة، أشعة إكس، فلم نيغاتيف، إلخ).
- تساعد تقنيات معالجة الصور على تحسين الصورة لتكون أقرب للفهم البشري.
- يمكن معالجة المعلومات، واستخراجها من الصور لتقوم الآلة بتفسيرها فيما بعد.
- يمكن معالجة البكسلات الموجودة في الصورة بحسب الكثافة، والتباين المرغوبين.
- يمكن تخزين الصور واستعادتها بسهولة.
- يمكن نقل الصور إلكترونيًا بسهولة إلى الآخرين.
بماذا عليك أن تفكر الآن؟
أدى نمو تقنيات التعلم العميق إلى تسريع مشاريع الرؤية الحاسوبية مفتوحة المصدر، ما أدى بدوره إلى زيادة الحاجة إلى أدوات معالجة الصور. إذ يتزايد الطلب على المهنيين ذوي المهارات الأساسية في تقنيات التعلم العميق بوتيرة سريعة كل عام. فإذا كنت ترغب في معرفة المزيد حول معالجة الصور وفوائد التعلم العميق، لا بدّ من التدريب، والحصول على الشهادات في هذا المجال. إذ يمكن أن تتقن جميع مفاهيم ونماذج التعلم العميق باستخدام أطر عمل Keras وTensorFlow، وتنفيذ خوارزميات التعلم العميق. ابدأ باتباع الدورات التدريبية اليوم، لتبدأ في مسار وظيفي ناجح في التعلم العميق.
اقرأ أيضًا:
باحثون صنعوا كاميرا لاسلكية لتصوير أعماق المحيطات دون الحاجة إلى أي نوع من البطاريات
الكاميرا الرقمية الأكبر في العالم: أطول من السيارة وتساوي دقة 266 كاميرا جهاز أيفون
ترجمة: أحمد عضيم
تدقيق: منال توفيق الضللي
مراجعة: محمد حسان عجك