أطلقت الصين منافسًا رخيصًا ومفتوح المصدر لبرنامج شات جي بي تي من شركة أوبن إيه آي. وقد أثار ذلك حماس بعض العلماء وأثار قلق وادي السيليكون.
كشفت شركة ديب سيك-وهي مختبر الذكاء الاصطناعي الصيني الذي يقف وراء هذا الابتكار- عن نموذج اللغة الكبيرة المجاني (LLM) ديب سيك-V3 في أواخر ديسمبر 2024، وتزعم أنه بُني في شهرين مقابل 5.58 مليون دولار فقط، وهو جزء بسيط من الوقت والتكلفة المطلوبين من قبل منافسيها في وادي السيليكون.
أُطلق -في أعقاب ذلك مباشرة- نموذج أحدث يسمى ديب سيك-R1 يوم 20 يناير. وفي اختبارات معيارية أجرتها جهات خارجية، تطابق ديب سيك-V3 مع قدرات جي بي تي-4o من أوبن إيه آي و كلاود سونيت 3.5 من أنثروبيك، بينما تفوق على نماذج أخرى، مثل لاما 3.1 من ميتا و كوين 2.5 من علي بابا، في المهام التي شملت حل المشكلات والترميز والرياضيات.
وقد تفوق نموذج R1 أيضًا على أحدث طراز o1 من شات جي بي تي في العديد من الاختبارات نفسها. وهذا الأداء المذهل -بتكلفة النموذج الضئيلة مقارنة بالطرازات الأخرى، وطبيعته شبه مفتوحة المصدر، وتدريبه على وحدات معالجة رسومية أقل بكثير- أدهش خبراء الذكاء الاصطناعي وأثار احتمال تفوق نماذج الذكاء الاصطناعي الصينية على نظيراتها الأمريكية.
وقال ساتيا ناديلا -الرئيس التنفيذي لشركة مايكروسوفت، الشريك الاستراتيجي لشركة أوبن إيه آي- في المنتدى الاقتصادي العالمي في دافوس بسويسرا في 22 يناير: «يتعين علينا أن نأخذ التطورات القادمة من الصين على محمل الجد».
تتعلم أنظمة الذكاء الاصطناعي باستخدام بيانات التدريب المأخوذة من المدخلات البشرية، ما يمكنها من إنشاء مخرجات تعتمد على احتمالات ظهور أنماط مختلفة في مجموعة البيانات التدريبية.
تكون هذه البيانات في نماذج اللغة الكبيرة نصية. على سبيل المثال، دُرِّب جي بي تي-3.5 من أوبن إيه آي-الذي صدر عام 2023- على ما يقرب من 570 جيجابايت من بيانات النصوص من مستودع Common Crawl -الذي يبلغ حجمه حوالي 300 مليار كلمة- مأخوذة من الكتب والمقالات عبر الإنترنت وويكيبيديا وصفحات الويب الأخرى.
إن نماذج الاستدلال -مثل R1 وo1- هي نسخة مطورة من نماذج LLM القياسية التي تستخدم طريقة تسمى سلسلة الفكر للرجوع إلى الوراء وإعادة تقييم منطقها، ما يمكنها من معالجة المهام الأكثر تعقيدًا بدقة أكبر.
وقد أدى هذا إلى جعل نماذج التفكير شائعة بين العلماء والمهندسين الذين يتطلعون إلى دمج الذكاء الاصطناعي في عملهم.
لكن على عكس نموذج o1 من شات جي بي تي فإن ديب سيك هو نموذج مفتوح الأوزان -مع أن بيانات التدريب الخاصة به تظل مملوكة- يسمح للمستخدمين بالتجسس داخل خوارزميته وتعديلها. ومن الأهمية بمكان أيضًا انخفاض سعره للمستخدمين 27 مرة أقل من o1.
إضافة إلى أدائها، فإن الضجة المحيطة بأداة ديب سيك تأتي من كفاءتها مقارنة بالتكلفة، فالميزانية المحدودة للنموذج ضئيلة مقارنة بالعشرات إلى مئات الملايين التي أنفقتها الشركات المنافسة لتدريب منافسيها.
إضافة إلى ذلك، فإن ضوابط التصدير الأمريكية، التي تحد من قدرة الشركات الصينية على الوصول إلى أفضل شرائح الحوسبة للذكاء الاصطناعي، أجبرت مطوري R1 على بناء خوارزميات أكثر ذكاءً وكفاءة في استخدام الطاقة للتعويض عن افتقارهم إلى قوة الحوسبة. وبحسب ما ورد احتاج شات جي بي تي إلى 10000 وحدة معالجة رسومية من نفيديا لمعالجة بيانات تدريبه، ويقول مهندسو ديب سيك إنهم حققوا نتائج مماثلة باستخدام ألفي وحدة فقط.
لكن ما زال من غير الواضح إلى أي مدى قد تترجم هذه الجهود إلى تطبيقات علمية وتقنية مفيدة، أو ما إذا كانت شركة ديب سيك قد دربت نموذجها ببساطة على اجتياز اختبارات القياس. ويستمر العلماء ومستثمرو الذكاء الاصطناعي بمراقبة الأمر عن كثب.
اقرأ أيضًا:
كل ما تريد معرفته عن أنظمة الطاقة الشمسية: آفاق استخدام التكنولوجيا الشمسية
ثورة تكنولوجيا الموصلات الفائقة مستمرة باختراع موصل فائق جديد
ترجمة: شهد حسن
تدقيق: تمام طعمة
مراجعة: باسل حميدي