تعد مكتبة دير سانت غال في سويسرا موطنًا لما يقرب من مائة وستين ألف مجلد من المخطوطات الأدبية والتاريخية التي يعود تاريخها إلى القرن الثامن مكتوبةً باليد على ورق خاص وبلغات نادرًا ما يُتَحَدّث بها في العصر الحديث.
احتفظ بهذه النصوص -التي تقدر بالملايين- في المكتبات والأديرة في جميع أنحاء العالم، وهناك جزء كبير من هذه المجموعات متاح لعامة الناس في نسخٍ رقمية، ولكن الخبراء يقولون إن هناك قدرًا غير عادي من المواد لم تُقرأ قط، وكأنها تُخفي في أسطرها نوافذ على تاريخ العالم.
الآن، يطور الباحثون في جامعة نوتردام شبكة عصبية اصطناعية لقراءة الكتابة اليدوية القديمة المعقدة معتمدين الإدراك البشري؛ لتحسين قدرات التعلم العميق على التدوين.
قال والتر شيرر الأستاذ المساعد في قسم علم الحاسوب والهندسة في جامعة نوتردام: «نحن نتعامل مع الوثائق التاريخية المكتوبة بأساليب لم تعد عصرية كما كان منذ زمن طويل وتاريخها يعود إلى قرون عديدة وبلغات مثل اللاتينية التي نادرًا ما تستخدم في زماننا».
وأضاف: «يمكن الحصول على صور جميلة لهذه المواد، ولكن ما وضعناه هو أن ننسخ آليًا بطريقة تحاكي منظور الصفحة عبر عيون القارئ الخبير وتقدم قراءة سريعة مع قابلية البحث في النص».
وفي بحث نشر في مجلة معهد مهندسي الكهرباء والإلكترونيات بشأن تحليل الأنماط وذكاء الآلة، يوجز شيرر كيف جمع فريقه بين الأساليب التقليدية للتعليم الآلي والفيزياء النفسية البصرية، وهي طريقة لقياس الروابط بين المحفزات الجسدية والظواهر العقلية؛ مثل مقدار الوقت الذي يستغرقه تعرف القارئ الخبير بطابع محدد أو قياس حسن الكتابات اليدوية أو تحديد استخدام بعض الاختصارات.
درس فريق شيرير المخطوطات اللاتينية بنسخة رقمية التي كتبها النّسّاخ في دير سانت غال في القرن التاسع. إذ أدخل القرّاء نسخهم اليدوية في واجهة برمجية مصممة خصيصًا، ثم قاس الفريق أوقات رد الفعل في أثناء النسخ لفهم الكلمات والشخصيات والمقطوعات التي تنوعت بين السهلة والصعبة.
وأوضح شيرر: «إن إدراج هذا النوع من البيانات يخلق شبكة أكثر اتساقًا مع السلوك البشري، ويقلل من الأخطاء ويوفر قراءة أكثر دقة وواقعية للنص».
قال شيرير: «إنها استراتيجية لا تُستخدم عادة في تعليم الآلات، إذ نُصنف البيانات على أساس هذه القياسات النفسية الفيزيائية التي تأتي مباشرة من الدراسات النفسية للإدراك بأخذ القياسات السلوكية، ثم نبلغ الشبكة بالصعوبات المشتركة في إدراك هذه الحروف ويمكن إجراء تصويبات على أساس تلك القياسات».
إن استخدام التعلم العميق لنسخ النصوص القديمة هو شيء ذو أهمية كبيرة للعلماء في العلوم الإنسانية.
قال هيلديغوند مولر الأستاذ المشارك في قسم الكلاسيكيات في نوتردام: «هناك فرق بين مجرد أخذ الصور وقراءتها، وبين وجود برنامج لتقديم قراءة ذات قابلية للبحث، إذا نظرتم إلى النصوص المستخدمة في هذه الدراسة (مخطوطات القرن التاسع) فتلك مرحلة مبكرة من العصور الوسطى؛ أي قبل وقت طويل من ظهور المطبعة، وفي هذا الوقت نُسِخَت كمية هائلة من المخطوطات، هناك جميع أنواع المعلومات المخبأة في هذه المخطوطات ونصوصها المجهولة التى لم يرها أحد من قبل».
وقال شيرير: «إن العديد من التحديات ما تزال قائمة، ويعمل فريقه على تحسين دقة النُسَخ، لا سيما في حالة الوثائق التالفة وغير المكتملة، فضلًا عن كيفية حساب الرسوم التوضيحية أو الجوانب الأخرى لصفحة يمكن أن تكون مربكة للشبكة».
ومع ذلك فقد تمكن الفريق من تعديل البرنامج لنسخ النصوص الإثيوبية، وتكييفها مع لغة ذات مجموعة مختلفة تمامًا من الحروف؛ ما يعد خطوة أولى نحو تطوير برنامج مع القدرة على نسخ وترجمة المعلومات للمستخدمين.
قال مولر: «يمكن أن يكون البرنامج مفيدًا حقًا في المجال الأدبي، فكل عمل أدبي جيد محاط بكمية كبيرة من الوثائق التاريخية ولكن البرنامج سيكون مفيدًا حقًا في البحوث الأرشيفية التاريخية، هناك حاجة كبيرة للنهوض بالإنسانيات الرقمية. عندما تتحدث عن العصور الوسطى وأوائل العصر الحديث، إذا كنت تريد فهم تفاصيلها وعواقب الأحداث التاريخية عليك النظر عبر المواد المكتوبة، وهذه النصوص هي الشيء الوحيد لدينا».
وأضاف: «قد تكون المشكلة أكبر خارج العالم الغربي؛ فعلينا التفكير في اللغات التي تختفي في الثقافات تحت التهديد الوجودي، ويجب علينا أولًا المحافظة على هذه الأعمال، وجعلها في متناول اليد، وأن ندمج في مرحلة ما هذه الترجمات لجعلها جزءًا من الثقافات التي ما زالت نابضة، فنحن نتسابق مع الزمن لتحقيق هذا».
اقرأ أيضًا:
سبع فوائد للذكاء الاصطناعي ستساعد البشرية
الذكاء الاصطناعي ذو التعلم العميق تمكن رسميًا من فك شيفرة معادلة شرودنجر
ترجمة: أحمد أبو شمالة
تدقيق: تسبيح علي