علم المعلوماتية الحيوية بأنّه علم هجين يربط البيانات الحيوية مع تقانة تحليل وتوزيع وتخزين المعلومات لدعم العديد من مجالات البحث العلمي متضمّنةً الطب الحيوي، يتطوّر علم المعلوماتية الحيوية بفضل تجارب توليد البيانات عالية الإنتاجيّة متضمنّةً تعيين التسلسل الجينومي وقياسات أنماط التعبير الجيني، إذ تنظّم المعلوماتيّة الحيويّة بيانات هذه التجارب ثمّ تنشرها على الشبكة العنكبوتيّة.
اكتشفت العديد من التطبيقات الهامّة للمعلوماتية الحيوية في مجال الطب، إذ استُخدمت لتعيين العلاقة بين التسلسلات الجينيّة والأمراض، ولتوقّع بنية البروتين متضمنّةً تسلسل أحماضه الأمينية، وللمساعدة على تصميم أدوية جديدة، ولتصميم علاجات لكل مريض على حدا بناءً على تسلسل الدنا الخاص به (علم الصيدلة الجينومي).
بيانات المعلوماتية الحيوية
تتضمن البيانات التقليدية للمعلوماتية الحيوية كل من تسلسلات الدنا للجينات أو كامل الجينوم، وتسلسلات الأحماض الأمينية للبروتينات، والبنى ثلاثيّة الأبعاد للبروتينات ومعقّدات الحموض النوويّة ومعقدات البروتينات مع الحموض النووية. تتضمن بيانات الأوميكس الإضافيّة كل من:
- الترانسكربتوميكس: نمط الرنا المصطنعة من الدنا في الخليّة.
- البروتيوميكس: نمط البروتينات وتوزّعها في الخليّة.
- الإنترأكتوميكس الممثّل لجميع التأثيرات بين البروتينات مع بعضها وبين البروتينات والحموض النوويّة.
- الميتابولوميكس الممثّل لطبيعة وحركيّة أنماط تحوّل الجزيئات الصغيرة عبر المسارات الكيمائيّة الحيويّة الفعّالة في الخليّة.
يوجد اهتمام في كل حالة للحصول على بيانات دقيقة وشاملة لأنماط خلوية معينة، ولتحديد أنماط التباين في هذه البيانات، إذ من الممكن أن تتغيّر هذه البيانات بناءً على نوع الخلية، أو توقيت جمع البيانات (خلال الدورة الخلويّة أو التغيّرات اليوميّة أو الموسميّة أو السنويّة)، أو مرحلة التطوّر، أو الظروف الخارجيّة المختلفة، يُوَسّع كل من علم الميتاجينوميكس وعلم الميتابروتيوميكس هذه القياسات للحصول على وصف شامل للكائنات الحيّة في عيّنة بيئيّة مثل دلو من مياه المحيط أو عيّنة من التّربة.
أدّى التسارع الكبير في عمليات توليد البيانات في علم الأحياء إلى دفع علم المعلوماتية الحيوية إلى الأمام ويبدو أنّ وسائل سلسلة الجينوم كان لها التأثير الدراماتيكي الأكبر على تطور علم المعلوماتية الحيوية. احتوى أرشيف سلسلة الحموض النووية عام 1999 على 3.5 مليار نكليوتيد، وبعد عشرة سنوات احتوى هذا الأرشيف على 283 مليار نكليوتيد أي ما يعادل طول 95 جينوم بشري. تحدت المعاهد الوطنية للصحة في الولايات المتحدة الباحثين، إذ وضعت هدفًا لتقليل تكلفة سلسلة الجينوم البشري إلى 1000 دولار ما يزيد من إتاحة تقنية سلسلة الجينوم لفئة أكبر من الأفراد ويجعلها أداة عمليّة لعيادات ومشافي الولايات المتحدة وتصبح أداة قياسية للتشخيص.
تخزين واسترجاع البيانات
تُستَخدَم بنوك البيانات في المعلوماتية الحيوية لتخزين وتنظيم البيانات، إذ تجمع تسلسلات الدنا والرنا من الأوراق البحثية والمشاريع الجينومية. توجد العديد من قواعد البيانات في أيادي هيئات عالميّة مثل اللجنة الاستشارية لقاعدة بيانات سلسسلة النكليوتيد المكونة من أعضاء مخبر البيولوجيا الجزيئية الأوروبي (EMBL-Bank) في المملكة المتحدة، وبنك بيانات الدنا في اليابان (DDBJ)، والبنك الجيني للمركز الوطني لمعلومات التقانة الحيوية (NCBI) في الولايات المتحدة المشرف على التعاون الدولي لقاعدة بيانات سلسلة النكليوتيد (INSDS). تشترط المجلات العلمية على الباحثين إيداع تسلسلات النكليوتيدات الجديدة في قاعدة بيانات متاحة للجميع لنشر المقال وذلك لضمان إتاحة بيانات التسلسلات الجينومية للجميع مجانًا (يوجد شروط مماثلة لبنية البروتينات والحموض النووية)، يوجد أيضًا محركات بحث جينومية وهي قواعد بيانات تجمع المعلومات الجزيئية والجينومية المتاحة عن أنواع محددة.
يُمثل بنك بيانات البروتين العالمي (wwPDB) قاعدة البيانات الأكبر لبنية الجزيئات الكِبرية الحيوية وهي ناتجة عن تعاون بين هيئة البحث التعاوني للمعلوماتية الحيوية البنيوية (RCSB) في الولايات المتحدة وبنك بيانات البروتين الأوروبّي (PDBe) في معهد المعلوماتية الحيوية الأوروبي في المملكة المتحدة وبنك بيانات البروتين الياباني في جامعة أوساكا. تحتوي الصفحات الرئيسيّة لشركاء wwPDB على روابط لملفات البيانات نفسها وللمعلومات التفسيرية والتعليمية ذاتها متضمنةً العناصر الإخبارية وتسهيلات لإيداع المُدخلات الجديدة وبرامج البحث المتخصصة باسترجاع البنى.
تُستَخدم أدوات قياسية لاسترجاع المعلومات من أرشيفات البيانات إذ تُعرّف عناصر البيانات من خلال كلمات مفتاحية، قد يكتب شخص ما (aardvark myoglobin) على محرك البحث غوغل ليسترجع تسلسل الأحماض الأمينية للجزيء، تبحث خوارزميّات أخرى في بنوك البيانات لتحديد التشابه بين عناصر البيانات، إذ يوجد مشكلة على سبيل المثال في سبر قاعدة بيانات تحتوي على تسلسلات جينية أو بروتينية بحثًا عن تسلسل معين لتحديد الكيانات المتشابهة في تسلسلاتها.
أهداف المعلوماتية الحيوية
يُمثل تطوير خوارزميات فعالة لقياس التشابه بين التسلسلات هدفًا هامًا للمعلوماتية الحيوية، تضمن خوارزمية نيدليمان-ونسش المعتمدة على البرمجة الحركية إيجاد الترتيب المثالي لمجموعة أزواج من التسلسلات، إذ تقسم هذه الخوارزمية أساسًا المشكلة الكبيرة (التسلسل الكامل) إلى سلسلة من المشكلات الصغيرة (مقاطع التسلسلات القصيرة) ثم تستخدم حلول المشكلات الصغيرة لبناء حل للمشكلة الكبيرة، تُسجل أوجه التشابه بين التسلسلات في مصفوفة، إذ تسمح هذه المصفوفة برصد الفجوات في ترتيب التسلسل.
على الرغم من فعالية هذه الخوارزمية فهي بطيئة في سير قاعدة بيانات التسلسلات كبيرة الحجم، ما أدى إلى ازدياد الاهتمام بإيجاد خوارزمية قادرة على استرجاع المعلومات بسرعة وتستطيع التعامل مع كميات كبيرة من البيانات في الأرشيف. يمثل برنامج بلاست أحد الأمثلة على هذه الخوارزميات، أدى تطوير برنامج بلاست إلى إصدار برنامج PSI-BLAST الذي يستخدم أنماط المحافظة بين التسلسلات المتقاربة ويدمج السرعة العالية لبرنامج بلاست مع الحساسية العالية جدًّا لإيجاد التسلسلات المتقاربة.
يمثل توسيع البيانات التجريبيّة عبر توقع نتائجها واحدًا من أهم أهداف المعلوماتية الحيوية، إذ يمثل التنبؤ ببنية البروتين اعتمادًا على تسلسل حموضه الأمينية الهدف الرئيسي لعلم الأحياء المحوسب، يزيد الطي العفوي للبروتينات من احتمالية حدوث التنبؤ ببنية البروتين مستقبلًا. يُقاس التقدم في تطوير وسائل للتنبؤ ببنية البروتين اعتمادًا على برامج التقييمات الهامة للتنبؤ بالبنية (CASP) الدائمة متضمنةً اختبارات عمياء لوسائل التنبؤ بالبنية.
تُستخدم المعلوماتية الحيوية أيضًا لتوقع التأثرات بين البروتينات بناءً على بنية كل بروتين منهم وهذا ما يدعى بمشكلة الإرساء. تُظهِر معقدات بروتين-بروتين تكاملًا جيدًا في شكل وقطبية السطح وتؤدي التآثرات الضعيفة دورًا كبيرًا في ثباتية هذه المعقدات، مثل: قوى فاندرفالس، والروابط الهدروجينية، ودفن السطوح الكارهة للماء، تُحاكي البرامج الحاسوبية هذه التآثرات للتنبؤ بالعلاقة الفراغية المثلى بين جزيئين مرتبطين، يُمثل تصميم أضداد ترتبط بإلفة عالية مع البروتين الهدف أهم التحديات التي تواجه المعلوماتية الحيوية لإيجاد تطبيقات علاجية.
تركّزت أبحاث المعلوماتية الحيوية في البداية على محاور ضيقة نسبيًّا إضافة إلى تركيزها على بناء خوارزميات لتحليل أنماط محددة من البيانات مثل تسلسل الجينات وبنى البروتينات. أصبحت أهداف المعلوماتية الحيوية الآن أكثر تكاملية وتهدف إلى اكتشاف كيفية استخدام مجموعات من أنواع مختلفة من البيانات لفهم الظواهر الطبيعية مثل الكائنات الحية والأمراض.
اقرأ أيضًا:
ترجمة: حسن دعبول
تدقيق: حنين سلَّام
مراجعة: مازن النفوري