الآلات ستفهمك أكثر بعد الآن !


إذا كنت قد سئمت من سوء فهمك من قبل برامج الدردشة مع الذكاء «chatbots»، فإن مايكروسوفت قد جعلت آذان الجهاز أكثر انتباهًا.

حيث استطاع باحثو عملاق التكنولوجيا الوصول إلى معدل خطأ منخفض بشكل لافت (6.3%) أثناء اختبارهم لنظام التعرف على الكلام وذلك بحسب دراسة نُشِرَت بتاريخ 12/09/2016 على خادم «arXiv»، وكانت الدراسة تحت عنوان: «نظام مايكروسوفت 2016 للتعرف على الكلام».

وهذا ما يتناغم مع استراتيجيات مايكروسوفت لتوفير مزيد من تجارب الحوسبة الشخصية كالمساعد الشخصي «كورتانا»، مترجم «سكايبي»، والخدمات المتعلقة بإدراك الكلام.

كما أن هذا البحث هام لاستراتيجيات مايكروسوفت الشاملة في الذكاء الاصطناعي لتوفير أنظمة يمكنها توقع حاجيات المستخدمين بدلًا من الاستجابة لأوامرهم، وكذلك لطموحات الشركة بتصميم أنظمة قادرة على الرؤية والسمع والتحدث وحتى الفهم، وزيادة القدرة على معرفة كيفية عمل الإنسان.

يعتبر معدل الخطأ 6.3% الأكثر انخفاضًا في مجال الصناعة، وذلك حسب «تشيودونغ هوانغ – Xuedong Huang»، رئيس قسم اللغة بمايكروسوفت.

وفي الوقت نفسه، أعلنت IBM مؤخرًا وصولها لمعدل خطأ يعادل %6,6، أي بتحسين يقارب %0,3 عن معدل شهر أبريل/نيسان الماضي (6,9%)، وقبله 8% العام الماضي.

خلال العقدين الماضيين، كان معدل خطأ أفضل نظام بحث تم نشره هو 43%، أي أن لفريق مايكروسوفت اليوم كل الأسباب ليكون فخورا، وذلك بحسب التقارير التي تشير إلى أن مايكروسوفت احتلت المركز الأول في هذا المجال.

في مجال تطوير الذكاء الاصطناعي، يقوم الباحثون بنمذجة آلات تحاكي البشر عن طريق تجهيز أنظمتها بالقدرة على التحدث، الرؤية والسمع.

يقول «ليام تونج – Liam Tung» صحفي شبكة ZDNET المتخصص في تكنولوجيا الأعمال:

«ومع ذلك، في هذه الأيام ومع مزيد من الأموال التي تضخ لتمويل الأبحاث في مجال «الشبكات العصبونية العميقة»، يتفاخر عمالقة التكنولوجيا بتحقيق معدل خطأ أدنى من 10%، لكن لا أحد يصل إلى مستوى يتجاوز دقة إدراك الإنسان، حيث يبلغ معدل الخطأ البشري في مجال التعرف على الكلام حوالي 4%، وذلك حسب IBM».

هذا التقدم المتزايد في تحقيق معدلات خطأ أكثر انخفاضًا يجعل الآلات أقرب من قدرات البشر.

يقول «هوانغ»:

«هذا الإنجاز تم تحقيقه عن طريق مجموعة واسعة من التقنيات الجديدة المطورة من قبل مجتمعات الذكاء الاصطناعي التابعة للعديد من المنظمات المختلفة خلال العشرين سنة الماضية».

بعض من هذه التقنيات تتضمن أنظمة مستوحاة من البيولوجيا تسمى «الشبكات العصبية» وتقنيات تدريب تدعى «التعلم العميق»، إضافة إلى اعتماد وحدات المعالجة الرسومية (GPU) لمعالجة الخوارزميات.

حيث يستخدم النظام مجموعة من التلافيف والشبكات العصبية المتكررة على غرار تقنيات «التعلم الآلي – Machine learning». وما يجعله مختلفًا عن الأعمال السابقة هو أن شبكات أكثر عمقًا، واستخدامه لاتصالاتٍ التفافيةٍ خطية عبر طبقات التلافيف.

خلال العامين الماضيين، مكنت الشبكات العصبية والتعلم العميق باحثي الذكاء الاصطناعي من تطوير وتدريب أنظمة متقدمة في مجال التعرف على الكلام، التعرف على الصور، ومعالجة اللغات الطبيعية.

السنة الماضية، ابتكرت مايكروسوفت برنامجا للتعرف على الصور يتفوق على الإنسان.

العنصر الآخر البالغ الأهمية في نجاح باحثي مايكروسوفت مؤخرًا هو «أدوات الشبكة الحاسوبية – Computational Network Toolkit» (CNTK)، وتوفر تحقق هذه المجموعة من الأدوات تحسينات متطورة تمكن خوارزميات «التعلم العميق» من تنفيذ الأوامر المعقدة بشكل أسرع من ذي قبل.

هذه الخطوة الهامة كانت عبارة عن انطلاقة حقيقية نحو التدريب المتوازي على وحدات المعالجة الرسومية (GPU).

على الرغم من أن وحدات المعالجة الرسومية صممت من أجل الرسوميات الحاسوبية إلا أن باحثي مايكروسوفت وجدوا أن وحدات المعالجة الرسومية جيدة جدًا لمعالجة الخوارزميات المعقدة كالتي تستخدم لفهم الكلام.

اليوم بدأ استخدام الأداة CNTK من طرف فريق يقوم بمساعدة «كورتانا»، المساعد الافتراضي لمايكروسوفت.

من خلال الدمج بين استخدام هذه الأداة ومجموعات وحدة المعالجة الرسومية، يستطيع الذكاء الاصطناعي «كورتانا» اليوم معالجة بيانات أكثر بمقدار عشر مرات في نفس المدة المستغرقة سابقًا.

يقول «تونج»:

«على غرار منافسيها، جعلت مايكروسوفت من الذكاء الاصطناعي دعامةً أساسيةً في استراتيجيتها من أجل تفاعلٍ «انسان- حاسوب» مع منصات العمل المعتمِدة على الصوت مثل مجموعة كورتانا، وذلك للعب دور أساسي في دمج الحوسبة ضمن الأجهزة القابلة للارتداء، الأجهزة المحمولة، المنزل، المركبات والمؤسسات.

بتقدم كهذا، قد تصبح إعادة السؤال على «chatbots» شيئًا من الماضي.


إعداد: نغم الماغوط
تدقيق: المهدي الماكي
المصدر الأول
المصدر الثاني
المصدر الثالث