بينت دراسة أن الذكاء الاصطناعي يستطيع تحديد العرق من الصور الطبية التي لا تملك أية مؤشرات عرقية قابلة للكشف اعتمادًا على الخبرة البشرية. ويعد سوء تعليم الخوارزميات مشكلة خطرة، وذلك عندما يعكس الذكاء الاصطناعي الأفكار اللاواعية والعنصرية والانحياز البشري لمنشئي تلك الخوارزميات، ما قد يؤدي إلى ضرر جسيم.
مثلًا، أخطأت برامج الحاسوب بإظهار أن المدعى عليهم من سمر البشرة قد يعيدون ارتكاب الجريمة باحتمالية مضاعفة عن بيض البشرة. وعندما استخدم الذكاء الاصطناعي التكلفة وسيطًا لتقييم الاحتياجات الصحية، بيّن أن المرضى سمر البشرة أكثر صحة من المرضى بيض البشرة مع أنهم بنفس مستوى المرض، وذلك لأن الإنفاق عليهم كان أقل. حتى الذكاء الاصطناعي الذي استُخدم في كتابة مسرحية اعتمد على الصور النمطية المؤذية لاختيار الطاقم.
يبدو حذف هذه السمات الحساسة من البيانات سهل التطبيق، لكن ماذا إن لم يكن الأمر كافيًا؟
أمثلة التحيز في معالجة اللغة الطبيعية لا حدود لها، لكن علماء معهد ماساتشوستس للتكنولوجيا (MIT) تحرَّوا عن طريقة أخرى مهمة وغير مستعملة بكثرة وهي الصور الطبية. واعتمادًا على البيانات الخاصة والعامة، وجد الفريق أن الذكاء الاصطناعي يستطيع التنبؤ بدقة بالأصل العرقي الذي يبلغ عنه المرضى ذاتيًا من الصور الطبية فقط.
باستخدام الأشعة السينية للصدر وللأطراف والثدي (ماموغرام) والتصوير المقطعي المحوسب للصدر، درب الفريق نموذج تعلم عميق لتحديد العرق (أبيض أو أسود أو آسيوي) مع أن الصور نفسها لا تذكر صراحةً عرق المريض. وحتى الأطباء المخضرمين لا يستطيعون إتمام هذه المهمة، وليس من الواضح كيف تمكن النموذج من تحقيق ذلك.
في محاولة لفهم كيفية حدوث هذا الأمر الغامض أجرى الباحثون الكثير من التجارب. فدرسوا الاختلافات التشريحية، وكثافة العظام، ودقة الصور والكثير غيرها في سبيل تحري الآليات المحتملة لكشف العرق، ولا تزال نماذج الذكاء الاصطناعي مسيطرة بتمتعها بقدرة عالية على ذلك من صورة الصدر البسيطة.
تقول مرظية قاسمي المؤلفة المشاركة في البحث والأستاذة المساعدة في قسم الهندسة الكهربائية وعلوم الكمبيوتر بمعهد MIT ومعهد الهندسة الطبية والعلوم (IMES)، التي تتبع أيضًا لمختبر علوم الكمبيوتر والذكاء الاصطناعي (CSAIL) وعيادة جميل في MIT:
«النتائج مشتتة في البداية، لأن أعضاء فريق البحث لدينا لم يقتربوا من تحديد بديل جيد لهذه المهمة … وحتى عند فلترة الصور الطبية القديمة التي بالكاد تعد صورًا طبية، تحافظ نماذج الذكاء الاصطناعي العميقة على أداء عالٍ جدًا. هذا أمر مقلق لأن القدرات الخارقة يصعب التحكم بها وتنظيمها ومنعها من إيذاء الناس».
الاعتماد على المعلومات الطبية قد يساعد الخوارزميات في فرز المرضى، وتحديد إن كان المريض مرشحًا للعلاج الكيميائي، أو تحديد إن كان الانتقال إلى وحدة العناية المركزة ضروريًا.
يقول ليو أنتوني سيلي المؤلف المشارك وعالم الأبحاث الرئيسي في IMES في MIT وأستاذ الطب المساعد في كلية الطب بجامعة هارفارد:
«نظن أن الخوارزميات تبحث فقط في العلامات الحيوية أو التحاليل المخبرية، لكن من المحتمل أنها تبحث أيضًا عن عرقك أو جنسك، وسواء كنت مسجونًا أم لا، حتى إذا كانت هذه المعلومات مخفية … فامتلاك تمثيل لمجموعات مختلفة في الخوارزمية لا يضمن أنها لن تؤدي إلى استمرار أو تضخيم الفوارق وعدم المساواة القائمة. إن تغذية الخوارزميات بمزيد من البيانات مع ذاك التمثيل ليس حلاً سحريًا. وفي ضوء هذه الورقة، يجب التوقف مؤقتًا وإعادة النظر حقًّا فيما إذا كنا جاهزين لجعل الذكاء الاصطناعي أقرب».
لإعداد الاختبارات، بيّن العلماء أولًا أن النماذج تنبأت بالعرق باستخدام طرق تصوير متعددة وبيانات وعمليات سريرية متنوعة ومجموعة من المراكز الأكاديمية والمرضى في الولايات المتحدة.
استُخدمت ثلاث مجموعات بيانية كبيرة لصور صدر شعاعية، واختُبر النموذج على مجموعة فرعية مخفية من مجموعة البيانات المستخدمة لتدريب النموذج إضافةً إلى مجموعة مختلفة تمامًا.
ثمّ دُرِّبت نماذج كشف العرق على صور أشعة سينية غير صدرية من عدة مواقع للجسم، ومن ضمنها التصوير الشعاعي الرقمي، والتصوير الشعاعي للثدي، والتصوير الشعاعي الجانبي للعمود الفقري، والتصوير المقطعي المحوسب للصدر، وذلك لمعرفة إذا اقتصر أداء نموذج الذكاء الاصطناعي على صورة الصدر البسيطة.
غطى الفريق عدة نقاط محاولًا شرح سلوك النموذج، وتضمن ذلك اختلافات الصفات الجسدية بين المجموعات العرقية (بنية الجسد وكثافة الثدي)، وانتشار المرض (أظهرت الدراسات السابقة أن المرضى سمر البشرة لديهم مشكلات صحية بنسبة أعلى مثل أمراض القلب)، والاختلافات الموضعية أو النسيجية، وآثار التحيز المجتمعي والضغط البيئي، وقدرة أنظمة التعلم العميق على اكتشاف العرق عند الجمع بين عوامل سكانية (ديموغرافية) وعوامل المريض، وإذا كانت مناطق صور معينة قد ساهمت في التعرف على العرق.
ما ظهر كان مبهرًا حقًا: كانت قدرة نماذج الذكاء الاصطناعي على التنبؤ بالعرق من خلال العلامات التشخيصية وحدها أقل بكثير من النماذج القائمة على صور الصدر البسيطة. ومثال ذلك عندما استعمل اختبار كثافة العظام صورًا يظهر فيها الجزء الكثيف من العظم أبيض اللون، والأرق رماديًا أو شفافًا.
افترض العلماء أن الاختلافات اللونية للعظام تساعد نماذج الذكاء الاصطناعي على اكتشاف العرق نظرًا لأن سمر البشرة لديهم كثافة معدنية عظمية أعلى.
ولحصر التحليل استخدموا مرشحًا (فلتر) لتقسيم الصور بطريقة لا يتمكن النموذج من تمييز اختلافات الألوان. واتضح أن إزالة اللون لم تؤثر في النموذج وما يزال بإمكانه التنبؤ بالعرق بدقة. فكانت قيمة المنطقة تحت المنحنى (أي مدى الدقة الكمية لاختبار التشخيص) بين 0.94 – 0.96. وبالنتيجة يبدو أن سمات النموذج المكتسبة تعتمد على نواحي الصورة كلها، ما يعني أن التحكم في هذا النوع من السلوك الخوارزمي أمر معقدٌ وصعب.
يقر العلماء بمحدودية علامات الهوية العرقية، ما جعلهم يركزون على السكان الآسيويين وسمر البشرة وبيض البشرة، وأن حقيقة الأمر هي بديهية. ستشمل المحاولات القادمة إمكانية عزل إشارات مختلفة قبل إعادة بناء الصورة، لأنه، كما هو الحال مع تجارب كثافة العظام، لم يستطيعوا تفسير ما تبقى من النسيج العظمي على الصور.
والجدير بالذكر أن أعمالًا أخرى من إنجاز قاسمي وسيلي بقيادة حماد آدم (طالب في MIT) وجدت أن النماذج تستطيع أيضًا تحديد العرق المبلغ عنه ذاتيًا من الملاحظات السريرية حتى عند تجريد هذه الملاحظات من مؤشرات العرق الواضحة.
قال سيلي: «نحن بحاجة إلى خبرة علماء الاجتماع، فالخبراء بالمجال كالأطباء وعاملي الصحة العامة وعلماء الكمبيوتر والمهندسين ليسوا كافيين. الرعاية الصحية هي مشكلة اجتماعية وثقافية بقدر ما هي طبية. ونحتاج إلى مجموعة أخرى من الخبراء للتقييم وتقديم المعلومات والردود حول كيفية تصميم هذه الخوارزميات وتطويرها ونشرها وتقييمها … نحتاج أيضًا إلى سؤال علماء البيانات قبل أي تفحص للبيانات: هل توجد تفاوتات؟ ما هي مجموعات المرضى المهمشة؟ ما هي أسباب هذه التفاوتات؟ هل هو الوصول للرعاية؟ هل هو تحيز من مقدمي الرعاية؟ إذا لم نفهم ذلك، فلن نستطيع تحديد عواقب الخوارزميات غير المقصودة، ولن توجد طريقة لحماية الخوارزميات من استمرار التحيزات».
يقول زياد أوبرماير الأستاذ المساعد في جامعة كاليفورنيا في بيركلي الذي تركز أبحاثه على تطبيقات الذكاء الاصطناعي على الصحة: «حقيقة أن الخوارزميات ترى العرق كما وثق المؤلفون بإقناع قد تكون خطيرة. ولكن توجد حقيقة مهمة مرتبطة وهي أنه عند استخدامها بعناية قد تعمل على مواجهة التحيز. في عملنا الخاص بقيادة عالمة الحاسوب إيما بيرسون في جامعة كورنيل، نظهر أن الخوارزميات التي تتعلم من تجارب المرضى الألمية قد تكشف مصادر جديدة لألم الركبة في الأشعة السينية، وهذه المصادر تصيب المرضى سمر البشرة على نحو غير متناسب مع غيرهم، ويفتقدها أطباء الأشعة على غير متناسب أيضًا. لذلك تمامًا كأي أداة، قد تكون الخوارزميات سيفًا ذو حدين، ويُعتمد علينا وعلى الخيارات التي نتخذها عندما نبني الخوارزميات».
اقرأ أيضًا:
النساء أكثر عرضة للوفاة بعد الجراحة إذا كان الجراح ذكرًا!
كيف تحافظ على صحة دماغك مع التقدم في العمر؟
ترجمة: شهاب شاعر
تدقيق: دوري شديد
مراجعة: محمد حسان عجك