اكتشاف طريقة جديدة وسهلة للعد، فكيف تعمل؟

يشكّل العلم أداة عظيمة لابتكار ما هو جديد وتحسين حياتنا، ولكننا لا نتوقع عادةً تحسين شيء جيّد نسبيًا بعد أن تعلمناه فترة طويلة، خصوصًا شيء مثل العد! فقد اكتشف العلماء طريقة جديدة للعد لم يلاحظها أحد حتى الآن، وهذا أمر بالغ الأهمية، وهي بسيطة بما يكفي ليفهمها طالب جامعي.

وجدت مجموعة من علماء الحاسوب طريقة جديدة لحل مشكلة عمرها عقود، وهي تتعلق بشي بسيط ظاهريًا (كم من الأشياء المختلفة أمامي؟)، لكنها مشكلة أصعب مما توحي كلماتها، وكان الحل أذكى مما نعتقد!

مسألة العناصر المختلفة

قد تكون الحواسيب ذكية جدًا، ولكنها قد تكون أيضًا ليست بذلك الكم من الذكاء، وذلك بالنظر مثلًا إلى ما راج من روبوتات الدردشة وبعد تخطّي روعة ما تبديه من ذكاء بوضعها على المحك، يظهر كثير من الهراء.

أحيانًا تبدو بعض الأمور بسيطة بالنسبة للإنسان بما يدعو إلى السخرية، لكنها قد تسبب أكبر المشكلات، فعملية عد الكائنات المميزة تحديدًا، سهلة بالنسبة لنا لأننا ننظر إلى مجموعة الكائنات، ويصنفها دماغنا تلقائيًا إلى مجموعات تعنينا، وبالكاد نبذل أي جهد في ذلك.

أما بالنسبة للحواسيب فهي تواجه منذ عقود مشكلة أساسية وقديمة تحتاج إلى الحل حقًا، وذلك نظرًا إلى تطبيقاتها الشاملة في العالم الحديث (بدءً من تحليل حركة الشبكة مثل مراقبة عدد الأشخاص المسجلين في وقت محدد على فيسبوك أو تويتر، إلى اكتشاف الاحتيال، وعلم الحيوية الحاسوبي، وتحليل النصوص، وغيرها الكثير…).

من الواضح أننا قد تمكنا من فعل تلك الأشياء لفترة طويلة الآن، لأن هذا السؤال المتعلق بالعد يقبل الإجابات بطرق مختلفة، لكنها ليست جيدة جدًا.

يقول فينودتشاندران فيريام في بيان له عام 2023 بوصفه أستاذ في كلية الحوسبة بجامعة نبراسكا-لينكولن «كانت جميع خوارزميات العد المعروفة سابقًا تعتمد على (التلبيد)، وجودة تلك الخوارزمية تعتمد على جودة توابع التلبيد التي تختارها الخوارزمية».

لكن، وبالتعاون مع زملائه سوراف تشاكرابورتي من المعهد الهندي للإحصاء وكولديب ميل من جامعة تورنتو، اكتشفوا طريقة لتبسيط المشكلة تبسيطًا مذهلًا:

«تعتمد الخوارزمية الجديدة فقط على استراتيجية أخذ العينات، وبالإمكان إجراء تحليل الجودة باستخدام تقنيات أساسية».

كيف تعمل؟

الخوارزمية الجديدة -باسم CVM نسبةً لمخترعيها- تقلل كثيرًا من متطلبات الذاكرة، وهو ميزة هامة في هذا العصر الحديث من البيانات الضخمة، وذلك باستخدام خدعة مميزة من نظرية الاحتمالات. ولتوضيح الفكرة، تخيل أنك تعدّ الكلمات الفريدة في هاملت لشكسبير لكن لديك ذاكرة تكفي فقط لتخزين 100 كلمة في كل مرة.

ستبدأ بفعل الأمر الواضح أولًا، تسجيل أول 100 كلمة فريدة تأتي في طريقك، وبعد أن تنفد المساحة تختار عشوائيًا إبقاء الكلمة أو نسيانها، ولنقل برمي عملة وربط القرار بالصورة أو الكتابة، وفي نهاية هذه العملية ستكون لديك حوالي 50 كلمة فريدة في قائمتك.

أعد العملية من البداية ولكن هذه المرة، إذا واجهت كلمة موجودة بالفعل في القائمة، ارمِ العملة مرة أخرى لتقرر حذفها أو الاحتفاظ بها، وعندما تصل إلى 100 كلمة، راجع القائمة مرة أخرى بنفس عملية رمي العملة.

في الجولة الثانية ستصبح الأمور معقدة قليلًا، فبدل الاحتفاظ بالكلمة بعد رمية واحدة، ابحث عن صورتين متتاليتين واحذفها لدى ورود أي شيء آخر. بالمثل في الجولة الثالثة، ستحتاج إلى رؤية ثلاثة صور متتالية، وفي الجولة الرابعة ستحتاج إلى أربعة رؤوس متتالية، وهكذا حتى تصل إلى نهاية هاملت.

يستند هذا الأسلوب المجنون إلى شيء ذكي، فالعمل بهذه الطريقة يضمن أن كل كلمة في القائمة لديها نفس احتمالية الوجود 1⁄2k إذ يمثل k عدد مرات وجوب مسح القائمة. فإذا افترضنا أنك أتممت ست جولات للوصول إلى نهاية هاملت، وتركت قائمة تحتوي على 61 كلمة متميزة، بإمكانك بعد ذلك ضرب 61 26 في للحصول على تقدير لعدد الكلمات.

الجواب التقديري 3,904 بينما الجواب الفعلي هو 3,967. وإذا كانت ذاكرة التخزين أكثر من 100 كلمة، سترتفع نسبة الدقة إلى مستويات أعلى، فمع القدرة على تخزين 1,000 كلمة تقدّر هذه الخوارزمية الجواب بنحو 3,964 وهو تقدير ضئيل للخطأ فعلًا، وبالتأكيد إذا كانت الذاكرة كبيرة بما يكفي لاحتواء جميع الكلمات بالوسع الحصول على دقة 100%.

منهج بسيط

إن ما يجعل الخوارزمية أكثر إثارة للاهتمام بجانب فعاليتها هو بساطتها، فقد قال أندرو ماكجريجور بوصفه أستاذ في كلية المعلومات وعلوم الحاسوب في جامعة ماساتشوستس أمهرست: «الخوارزمية الجديدة مذهلة ببساطتها وسهلة التنفيذ. … لن أتفاجأ إذا أصبح هذا هو الأسلوب الافتراضي لحل مسألة العناصر المختلفة في الممارسة العملية».

وقد جذبت الخوارزمية منذ نشرها في يناير 2023 انتباه كثير من علماء الحاسوب الآخرين وإعجابهم (باستثناء بعض الملاحظات البسيطة والأخطاء)، ما يعني أن البحث الذي يفصّل الخوارزمية خضع بالتأكيد لمراجعة الأقران عمليًا مع إنه لم يخضع لمراجعة الأقران رسميًا. وفي الواقع، كتب دونالد كنوث -مؤلف كتاب (فن برمجة الحاسوب) والملقب بأبو تحليل الخوارزميات- ورقة إشادة بالخوارزمية في مايو 2023: «منذ أن رأيتها […] لم أتمكن من مقاومة محاولة شرح الأفكار لجميع من أعرفه تقريبًا»، وأضاف أيضًا: «إنها مناسبة جدًا لتعليم الطلاب الذين يتعلمون أساسيات علوم الحاسوب … أنا متأكد من أن شيئًا كهذا سيصبح في النهاية موضوعًا قياسيًا في الكتب المدرسية».

وفي هذه الأثناء، أمضت فرق مختلفة العام الماضي في التحقيق في الخوارزمية وتنقيحها. وبحسب فاريام فإن بعض دورات علوم الحاسوب بدأت بتدريسها بالفعل، وقال: «نرى أنها ستكون خوارزمية رئيسية في دورات تدريس علوم الحاسوب الأولى، حول الخوارزميات عمومًا والخوارزميات الاحتمالية خصوصًا».

إذن، كيف لمثل هذه الخوارزمية المذلهة ألا تلفت الانتباه لفترة طويلة؟ وفقًا لفاريام، الأمر ليس غير محتمل كما يبدو. فقال: «قد يبدو أن عدم اكتشاف هذه الخوارزمية البسيطة سابقًا مفاجئًا … لكنه ليس من غير المألوف في العلم أن نتجاهل هذه البساطة طوال سنوات».

رياضيات المراهنة والمقامرة

ترجمة: زين العابدين بدّور

تدقيق: محمد حسان عجك

المصدر