السيارات ذاتية القيادة: أخيراً تتعلم القيادة مثلنا (وهذا مخيف قليلاً)

دعونا نواجه الأمر: لقد ظل وعد السيارات ذاتية القيادة يلوح أمامنا كجزرة معلقة على عصا لسنوات. وُعدنا بسائقين آليين، ورحلات خالية من التوتر، والقدرة على إنهاء حل الكلمات المتقاطعة أخيراً في طريقنا إلى العمل. لكن الواقع كان… متعثراً بعض الشيء.

حتى الآن، على ما يبدو. هناك ورقة بحثية جديدة تُحدث ضجة بنهج مفاجئ في بساطته: دع السيارات تتعلم القيادة من خلال اللعب ضد بعضها البعض. نعم، قرأت ذلك بشكل صحيح. إنه أشبه بسباق تحطيم السيارات، ولكن بالخوارزميات.

جيجافلو: حيث تذهب السيارات إلى مدرسة القيادة (وتثير الفوضى)

السر يكمن في نظام يسمى “جيجافلو”، وهو محاكي مجمّع قادر على توليف وتدريب ما يعادل ٤٢ عاماً من خبرة القيادة الذاتية في الساعة على عقدة واحدة بثماني معالجات رسومية. تخيل ساحة رقمية حيث تنشأ السيارات ذاتية القيادة، وتُعطى مجموعة أساسية من القواعد (لا تصطدم، صل إلى وجهتك)، ثم تُطلق للتنافس في الطرق الافتراضية. تتعلم من خلال المحاولة والخطأ، وتتكيف باستمرار مع أساليب القيادة… دعونا نقول “الفريدة” لبعضها البعض.

حقيقة مثيرة: في ١٠ أيام فقط من التدريب، قطعت هذه السيارات الذكية أكثر من ١,٦ مليار كيلومتر - 
وهي مسافة أكبر من المسافة بين الأرض وزحل! حديث عن رحلة طويلة...

النتيجة؟ سياسة واحدة تم تدريبها بالكامل عبر اللعب الذاتي تتفوق على الأداء السابق للتقنيات المتطورة في CARLA وnuPlan ومجموعة بيانات Waymo للحركة المفتوحة.

“دالة المكافأة المبسطة” - أو كيفية تعليم سيارة السلوك (نوعاً ما)

هنا الجزء المثير للاهتمام حقاً. لم يقم الباحثون بتغذية الذكاء الاصطناعي بتيرابايت من بيانات القيادة البشرية. بدلاً من ذلك، استخدموا “دالة مكافأة مبسطة”. بشكل أساسي، تتم مكافأة السيارات على:

  • الوصول إلى وجهتها
  • تجنب الاصطدامات
  • البقاء في مسارها
  • عدم تجاوز الإشارات الحمراء
  • الحفاظ على تسارع معقول

فكر في الأمر كتدريب جرو. لا تحتاج إلى عرض ساعات من مقاطع الفيديو للكلاب حسنة السلوك. فقط تعطيه مكافأة عندما يجلس وتوبخه عندما يقضم حذاءك المفضل.

الجيد والسيء والمضحك تماماً

الخبر السار هو أن هذا النهج يبدو أنه يعمل. تحقق السياسة الناتجة أداءً متطوراً على مقاييس متعددة للقيادة الذاتية، متفوقة حتى على الأنظمة المدربة على بيانات القيادة البشرية الواقعية. السيارات أيضاً متينة بشكل مدهش، حيث تقطع في المتوسط ١٧,٥ عاماً من القيادة المستمرة بين الحوادث في المحاكاة.

الخبر السيء؟ حسناً، إذا كانت السيارات تتعلم القيادة مثلنا، فهذا يعني أنها تتعلم أيضاً عاداتنا السيئة. توقع رؤية سيارات ذاتية القيادة تقطع الطريق على بعضها البعض، وتندمج في المسارات بطريقة عدوانية سلبية، وربما حتى حوادث غضب الطريق المدعومة بالذكاء الاصطناعي.

والمضحك تماماً؟ تخيل مستقبلاً حيث تُبرمج السيارات ذاتية القيادة لتكون مهذبة بشكل مفرط، متنازلة لكل مشاة وتسمح للجميع بالاندماج أمامها. ستتوقف حركة المرور حيث تدخل هذه السيارات المهذبة للغاية في حلقات لا نهائية من “بعدك، لا، بعدك.”

المستقبل (نأمل) أقل تعثراً

بالطبع، لا يزال هناك طريق طويل للقطع. كما يشير الباحثون أنفسهم، كانت العديد من المخالفات التي تعرض لها الذكاء الاصطناعي أثناء الاختبار بسبب قيود المقاييس نفسها، مثل المشاة الذين يندفعون إلى حركة المرور دون النظر. لكن حقيقة أن السيارات ذاتية القيادة يمكنها تعلم التنقل في البيئات المعقدة وغير المتوقعة من خلال اللعب الذاتي تعد خطوة كبيرة إلى الأمام.

لذا، في المرة القادمة التي ترى فيها سيارة ذاتية القيادة على الطريق، تذكر أنها ربما مرت بازدحامات مرورية محاكاة وحوادث وشيكة أكثر مما واجهت في حياتك كلها. وإذا قطعت عليك الطريق، تذكر فقط: من المحتمل أنها تتعلم من أفضل (أو أسوأ) ما فينا.

ملاحظة المحرر: لم تتعرض أي سيارات حقيقية للأذى في صنع هذا النظام الذكي.
رغم أن بعض السيارات الافتراضية بالتأكيد مرت بيوم صعب في العمل.

المصدر: الاستقلالية القوية تنبثق من اللعب الذاتي