يطول الحديث عن البيانات وأهميتها في الوقت الحالي ويرى البعض أنها بمثابة “النفط الجديد” للأجيال الحالية والقادمة. إذ إن البيانات تدخل في التقنيات التي نستخدمها اليوم عمومًا؛ يتضمن ذلك الهواتف المحمولة والطائرات، والسيارات.
لذلك يجب دائمًا تذكر كمية البيانات التي تولدها وكالة مثل وكالة ناسا، مسؤولة عن استخدام هذه البيانات لإظهار الأشياء على كوكب الأرض، وخارجه. إذ تُعد وكالة ناسا أحد أكبر المولدين للبيانات، والموزعين لها.
وتشمل البيانات التي تُعالجها ناسا تلك المعنية بتغير المناخ، ومؤخرًا بيانات متعلقةً بالكوكب الذي يُشبه الخاتم «زحل».
أرقام البيانات
جرى حديث بين كيفن ميرفي المسؤول عن برنامج ناسا لعلوم الأرض، وأنظمة البيانات المتعلقة بذلك، مع أحد الصحفيين لدى موقع Siliconrepublic.com. لقد اندهش الصحفي بالرقم الذي تحدث عنه كيفن.
يجري توليد ما يُعادل 12.1 تيرابايت من البيانات يوميًا من قبل ناسا، وقد حافظت ناسا على هذا الرقم منذ قرابة السنة الماضية حتى الآن. تأتي هذه البيانات لوكالة ناسا من الحساسات كافةً، والأنظمة الموزعة حول العالم، وفي الفضاء.
ستصل قدرات وكالة ناسا لتوليد البيانات إلى مستوى يسمح لها بخلق ما يُعادل 24 تيرابايت من البيانات يوميًا؛ ذلك سيكون ممكنًا بعد تطوير ناسا لمركباتها الفضائية لتصبح قادرةً على نقل البيانات بأحجام كبيرة وسرعة فائقة تزيد آلاف الأضعاف عن الإمكانيات المتوفرة المعتمدة على الليزر الضوئي.
تُضاف تلك البيانات كلها بعد ذلك إلى أرشيف سعته تقدر بنحو 24 بيتابايت، أو 24000000 غيغابايت. تلك أرقام تعجز الأجهزة الحالية عن الوصول إليها أو حتى الاقتراب منها.
ليس هذا كل شيء، فقد أضاف ميرفي؛ إنه خلال الخمس سنوات القادمة ستتضاعف سعة استيعاب الأرشيف ليصبح قادرًا على تخزين 50 بيتابايت من البيانات، مع تزايد إطلاق مهام لتحليل كوكب الأرض واستكشاف كواكب أخرى.
بالمقابل تُرسل خدمة البريد الأميركية نحو 5 بيتابايت من البيانات عبر الرسائل سنويًا.
كيف تُحافظ ناسا على كل هذه البيانات؟
يشرح ميرفي عملية جمع البيانات وتخزينها بأنها أمر بسيط في البداية. إذ مثل أيّ قسم معني بأمور تقنيات المعلومات، يجري التخطيط لكمية البيانات المتوقع توليدها، ولكن تبقى تلك مهمةً صعبةً لكثرة المتغيرات.
تعتمد ناسا على نظام متنوع لحفظ البيانات، إذ يعمل النظام على تقنيات التخزين السحابي من خلال منصة تجارية مصممة من قبل كبار الشركات التقنية مثل Google وAmazon، إضافةً إلى مراكز تخزين البيانات الخاصة بالوكالة.
أما الآن فتعمل ناسا على تخفيض عدد مراكز البيانات لديها. إذ تمكنت من إغلاق 33 مركزًا من أصل 59. ذلك تبعًا لتوصيات الحكومة الأميركية للتقليل من المساحة التي تحجزها هذه المراكز. وتسعى ناسا لتحقيق هذا الهدف قبل الموعد النهائي الذي وضعته الحكومة الأميركية سابقًا في 2018.
على عكس وكالات فيدرالية أخرى، يعمل على إدارة مراكز بيانات ناسا متخصصون ذوو خلفية تقنية وآخرون ذوو خبرة في إدارة البيانات. وتُصرح ناسا عن كل ما تفعله علنًا، ذلك يعني كل شيء حرفيًا على خلاف الوكالات الأخرى مثل CIA وNSA.
يقول ميرفي: «نتبع سياسةً خاصةً عند التعامل مع البيانات لدينا. إذ إن سياستنا مبنية على الصدق والانفتاح، والمجانية. ينطبق ذلك أيضًا على استخدامنا للخوارزميات المختلفة لتوليد البيانات، ومعايرة المعلومات، وكل ذلك يؤدي دورًا مهمًا في المجال العلمي».
خلال السنة الماضية فقط دخل أكثر من 3.2 مليون شخص إلى قواعد بيانات ناسا، للحصول على بيانات يُمكن استخدامها في مجال البحث العلمي، ما يعني أن هذه القواعد يجب أن تكون متاحةً للجميع في أي وقت ومن أي مكان.
أفضل مثال لقاعدة بيانات كبيرة توفرها ناسا للعامة هي OpenNASA، التي تحتوي على ما يزيد عن 32000 مجموعة بيانات، وأكثر من 50 API. يستطيع أي شخص الوصول إليها، وتحميلها، والتعديل عليها.
يقول ميرفي: «نواجه تحديات فريدة من نوعها عندما نعمل على توسيع نطاق هذه الأنظمة، لنتمكن من تلبية الطلب المتزايد للمستخدمين. لذا علينا أن نكون دائمًا حذرين عند البدء بتقديم خدمات جديدة للمستخدمين كل عام، لأنه من الممكن ألا نكون قادرين على توسيع نطاق استخدامها بما يكفي لتلبية طلبات الملايين من المستخدمين في الوقت ذاته».
دور الذكاء الاصطناعي في كل ما يجري
يتساءل العديد من العاملين ضمن ناسا عن الطريقة التي يُمكن بواسطتها إدارة أحجام من البيانات تصل إلى 5 وحتى 10 بيتابايت كل سنة، والحل بالنسبة لميرفي وزملائه يكمن في استخدام الذكاء الاصطناعي، وتقنية تعليم الآلة.
لقد عمل ميرفي سابقًا على استخدام هذا النوع من التقنيات لمعالجة بيانات متعلقة بالأعاصير، وظواهر مناخية أخرى. وجميعها كانت بيانات متعلقةً بما يحدث على كوكب الأرض. لذا سيؤدي الذكاء الاصطناعي دورًا مهمًا في مساعدة البشر على الربط بين البيانات من أجل تقديم بحوث جديدة في جميع المجالات.
يقول ميرفي: «يبحث الناس عند النظر إلى البيانات العلمية عن حالات شاذة، وصفات غير مألوفة؛ قد لا تشملها الإحصائيات المعروضة عن أمر معين. وهنا يبرز استخدام الذكاء الاصطناعي، وتعليم الآلة في تلبية هذه الحاجات».
تطرق إلى هذا الموضوع أيضًا عالمة البيانات، وعضوة في مجموعة متخصصي تعليم الآلة في مختبر Jet Propulsion كيري فاغستاف، عندما أكدت أن الذكاء الاصطناعي سيؤدي دورًا مهمًا في تهيئة المركبات الفضائية لناسا، من أجل حل المشكلات ذات الطابع العلمي، من دون التدخل البشري.
أكملت قائلة: «لا نريد تفويت شيء ما، لأننا لا نعلم أين نبحث عنه، لذلك نريد تطوير المركبات الفضائية لتصبح قادرةً على رؤية الأشياء الغريبة التي نتوقع وجودها في مكان ما في الفضاء، والتعرف عليها».
يقول ميرفي إن التحدي الأكبر لناسا سيكون في توسيع نطاق استخدام طرق تعليم الآلة مع تقديم البيانات المفتوحة من منظور عالم البيانات.
يقول ميرفي: «حتى الآن يعمل النظام الذي بين أيدينا بناءً على نموذج بسيط، إذ يستطيع شخص ما الوصول إلى ما يريد وتحميله، ولكن مع ازدياد حجم المنتجات -التي هي بالأساس ضخمة جدًا- ازديادًا كبيرًا، سيصبح من الصعب توسيع الأنظمة؛ على وجه الخصوص الأنظمة الموزعة لتلبية الطلب».
سيقع على عاتق العلماء في المستقبل تعليم الأجيال القادمة حول العالم كيفية معالجة البيانات بطرق تختصر عليهم العناء، باستخدام تقنيات متجددة ومتطورة، مثل الحوسبة الكمية، والسحابية.
وقد ساعد في جعل مستقبل ناسا مشرقًا إعلان الرئيس الأميركي السابق باراك أوباما، عن مبادرة Big Data Research and Development Initiative سابقًا عام 2012 التي من شأنها دعم الوكالات مثل ناسا على تطوير ما لديها، للتعامل مع كميات هائلة من البيانات.
يبدو أن ناسا حتى هذه اللحظة تخطو خطوةً صغيرةً في مجال البيانات، وتسعى إلى تحقيق نقلة نوعية بالنسبة لمستقبل البشرية ككل.
اقرأ أيضًا:
لماذا تخطط شركة مايكروسوفت لنقل مراكز بياناتها إلى تحت سطح الماء؟
ترجمة: طاهر قوجة
تدقيق: منال توفيق الضللي
مراجعة: لبنى حمزة