يستطيع الذكاء الصناعي اليوم أن يفك تشفير الكلمات عن طريق أمواج الدماغ، ويعلّم العلماء المختصّون بدراسة الجهاز العصبي الحواسيبَ قراءة الكلمات مباشرةً من دماغ البشر.
أعَدّ كيلي سيرفيك، الكاتب في موقع Science، هذا الأسبوع ثلاثة تقارير نُشرت في خادم ما قبل الطباعة bioRxiv تضمّت ثلاثة فرق مختلفة من الباحثين الذين يدّعون أن بإمكانهم فك ترميز أو تشفير الكلام بالاعتماد على تسجيلات لعملية تُدعى علميًّا احتراق العصب (وهي عملية تؤدي إلى زيادة سريعة في الشحنة الموجبة للنسيج العصبي).
في كل دراسة، عندما توضَع الأقطاب الكهربائية مباشرةً على الدماغ فإنّها تسجّل نشاطًا عصبيًا، وفي هذه الأثناء، يستمع مرضى العمليات الجراحية في الدماغ إلى حديث ما أو يقرؤون الكلمات بصوت مرتفع.
بعدها، يحاول الباحثون اكتشاف ما الذي يستمعون إليه المرضى أو يقرؤونه.
في كل مرة كان الباحثون قادرين على تحويل النشاط الكهربائي للدماغ بطريقة ما إلى ملفات صوتيّة واضحة.
نُشرَت الورقة الأولى في bioRxiv بتاريخ 10 تشرين الأول عام 2018، ووصفت تجربة شغّل فيها الباحثون التسجيلات الصوتية للكلام على مسمع مرضى داء الصّرع الذين كانوا في منتصف عملية جراحية للدماغ.
كان لا بد للتّسجيلات العصبية التي حُصل عليها من التجربة أن تكون مُفصّلة بما يكفي لترجمتها.
ولكي يُحصل على هذه الدرجة من التّفصيل يجب أن يكون الدماغ مكشوفًا ومُعرّضًا للهواء إذ توضَع الأقطاب الكهربائية عليه مباشرةً كما الحال في عملية جراحيّة للدماغ.
في أثناء استماع المرضى للتسجيلات، يسجّل الباحثون احتراقات الأعصاب في الأجزاء التي تُعالج الصوت من أدمِغة المرضى.
جرّبَ العلماء عددًا من الطرق المختلفة لتحويل بيانات احتراق الأعصاب إلى كلام، ووجدوا أن التعلّم العميق -والذي يحاول فيه الحاسوب حل مشكلة ما بطريقة أو بأخرى دون الإشراف المباشر- كان الأفضل.
عندما شُغّل الصوت باستخدام المُشفّر الصوتي (الذي يجمع الأصوات البشرية لمجموعة مكوّنة من 11 شخصًا مُستمعًا) استطاع هؤلاء الأشخاص تفسير 75% من الكلمات بشكل صحيح.
نُشرَت الورقة الثانية بتاريخ 27 تشرين الأول عام 2018 واعتمدَت على التسجيلات العصبيّة من مرضى أثناء العمل الجراحي لإزالة أورام دماغية.
في أثناء قراءة المرضى لكلمة بمقطع واحد وبصوت مرتفع، سجّل الباحثون كلًّا من الأصوات القادمة من أفواه المشاركين في التجربة والحريق العصبي في مناطق إنتاج الكلام في أدمغتهم.
وبدلًا من تمرين الحواسيب العميق لكل مريض، علّمَ الباحثون شبكة عصبية صناعية تحويل التسجيلات العصبية إلى ملفات صوتية، وقد أظهرت أن النتائج كانت معقولة ومفهومة إلى حد مقبول، ومُشابهة للتسجيلات التي أُنتجت بالاعتماد على مكبّرات الصّوت.
نُشرت الورقة الثالثة في 9 آب عام 2018، واعتمدت على التسجيل من الجزء الدماغيّ الذي يُحوّل كلمات محدّدة يقولها الشخص إلى حركات عضليّة.
وبالرغم من عدم وجود أي تسجيل من هذه التجربة مُتاحًا على الإنترنت، فقد نشر الباحثون أنّهم كانوا قادرين على تشكيل جُمل كاملة (سُجّلت في أثناء خضوع مرضى داء الصرع لعمل جراحي)، واستطاع النّاس الّذين استمعوا لهذه الجُمل تفسيرها بشكل صحيح من خلال اختبار يتضمّن أسئلة اختيار من متعدّد (أكثر من 10 خيارات) بنسبة 83% من المرات. اعتمدَت طريقة التجريب هذه على تحديد هويّة النماذج المُتعلّقة بإنتاج مقاطع فردية بدلًا من كلمات كاملة.
الهدف من كل هذه التجارب هو تمكين الأشخاص الذين فقدوا القدرة على الكلام (بسبب التصلّب الجانبي الضموري ALS أو حالات مشابهة) من الكلام من خلال وسيط حاسوبي – دماغي. ولكنّ العلم لم يصل بعد إلى هذا التطبيق.
يُعد تفسير أو ترجمة النّماذج لشخص يتخيّل الكلام فحسب أكثر تعقيدًا من تفسيرها لشخص يسمع أو يُنتج الكلام. هذا ما نشرَه موقع Science (ولكنَّ كاتبي الورقة الثانية قالوا إن تفسير نشاط الدماغ لشخص يتخيّل الكلام هو أمر ممكن).
من المهم أن نأخذ بعين الاعتبار أن كل هذه الدراسات ما تزال صغيرة.
اعتمدت الورقة الأولى على البيانات المأخوذة من خمسة أشخاص، بينما نظرت الورقة الثانية إلى حالة ستة أشخاص والثالثة ثلاثة أشخاص.
ولم تستمر أي من التسجيلات العصبية لأكثر من ساعة من الزمن.
ما يزال العلماء يتقدّمون، وتُبدي أجهزة الكلام الصناعي التي تتّصل بالدماغ إمكانيّة حقيقية بشكل أو بآخر كخطوة على الطريق الصحيح.
- ترجمة: كارينا معوض
- تدقيق: م. قيس شعبية
- تحرير: زيد أبو الرب