सेल्फ-ड्राइविंग कारें: अब इंसानों की तरह ड्राइविंग सीख रही हैं! 🚗

चलिए, ज़रा कड़वी हकीकत का सामना करते हैं: सेल्फ-ड्राइविंग कारों का वादा पिछले कई सालों से हमारे सामने उस ‘सुनहरे मृगतृष्णा’ की तरह रहा है, जो बस हाथ आने ही वाला होता है पर कभी आता नहीं। हमें सपने दिखाए गए थे रोबोटिक ड्राइवरों के, तनाव-मुक्त सफर के और दफ्तर जाते समय कार की पिछली सीट पर बैठकर आराम से अखबार पढ़ने के। लेकिन असलियत? असलियत अब तक काफी ‘झटकों’ भरी रही है।

लेकिन अब शायद हवा बदलने वाली है। एक नए रिसर्च पेपर ने टेक जगत में हलचल मचा दी है, और इसकी वजह है एक बेहद सरल सा नजरिया: कारों को आपस में ही ‘भिड़कर’ गाड़ी चलाना सीखने दो। जी हां, आपने सही पढ़ा। यह किसी ‘डेमोलिशन डर्बी’ जैसा है, बस फर्क यह है कि यहाँ ड्राइवरों की जगह एल्गोरिदम (algorithms) आपस में टकरा रहे हैं।

Gigaflow: जहाँ कारें ड्राइविंग स्कूल जाती हैं (और थोड़ा कोहराम भी मचाती हैं)

इस पूरी कलाकारी के पीछे “Gigaflow” नाम का एक सिस्टम है। यह एक ऐसा ‘बैच्ड सिम्युलेटर’ (batched simulator) है जो सिर्फ एक 8-GPU नोड पर हर घंटे 42 साल का ड्राइविंग अनुभव पैदा करने और उस पर ट्रेनिंग देने में सक्षम है। इसे एक डिजिटल ‘कुरुक्षेत्र’ की तरह समझिए, जहाँ सेल्फ-ड्राइविंग कारों को पैदा किया जाता है, उन्हें कुछ बुनियादी नियम दिए जाते हैं (जैसे—ठोकना मत, मंज़िल तक पहुँच जाना), और फिर उन्हें वर्चुअल सड़कों पर एक-दूसरे से मुकाबला करने के लिए खुला छोड़ दिया जाता है। वे अपनी गलतियों से सीखते हैं और एक-दूसरे के… चलिए, इसे थोड़ा सलीके से कहें तो “अतरंगी” ड्राइविंग स्टाइल के हिसाब से खुद को ढालते हैं।

मज़ेदार तथ्य: सिर्फ 10 दिनों की ट्रेनिंग में, इन AI कारों ने 1.6 अरब किलोमीटर से ज़्यादा का सफ़र तय किया - 
यह धरती से शनि (Saturn) तक की दूरी से भी ज़्यादा है! इसे कहते हैं एक लंबी रोड ट्रिप...

नतीजा? सिर्फ ‘सेल्फ-प्ले’ (self-play) के जरिए तैयार की गई एक अकेली पॉलिसी ने CARLA, nuPlan और Waymo Open Motion Dataset जैसे दिग्गजों के पुराने रिकॉर्ड्स को ध्वस्त कर दिया है।

“मिनिमलिस्ट रिवॉर्ड फंक्शन” – या कार को तमीज़ सिखाने का तरीका

यहाँ सबसे दिलचस्प बात यह है कि शोधकर्ताओं ने AI को इंसानी ड्राइविंग का टेराबाइट्स डेटा ‘घोंटकर’ नहीं पिलाया। इसके बजाय, उन्होंने एक “मिनिमलिस्ट रिवॉर्ड फंक्शन” का इस्तेमाल किया। आसान भाषा में कहें तो, कारों को इनाम तब मिलता है जब वे:

  • अपनी मंज़िल पर सही-सलामत पहुँचती हैं
  • टक्कर होने से बचती हैं
  • अपनी लेन में रहती हैं
  • रेड लाइट जंप नहीं करतीं
  • और गाड़ी की रफ्तार को काबू में रखती हैं

यह बिल्कुल वैसा ही है जैसे किसी पिल्ले (puppy) को ट्रेनिंग देना। आपको उसे घंटों तक आज्ञाकारी कुत्तों के वीडियो दिखाने की ज़रूरत नहीं है। जब वह बैठ जाए तो उसे बिस्किट दे दीजिए, और जब वह आपके पसंदीदा जूते चबाने लगे तो उसे डांट दीजिए।

अच्छी, बुरी और बेहद मज़ेदार बातें

अच्छी खबर यह है कि यह फॉर्मूला काम कर रहा है। यह AI पॉलिसी ऑटोनॉमस ड्राइविंग के कई मानकों पर खरी उतरी है और यहाँ तक कि असली इंसानी डेटा पर ट्रेन किए गए सिस्टम्स को भी पीछे छोड़ रही है। ये कारें हैरान करने वाली हद तक माहिर हो चुकी हैं—सिमुलेशन के दौरान ये औसतन 17.5 साल की लगातार ड्राइविंग के बाद ही किसी हादसे का शिकार होती हैं।

बुरी खबर? देखिए, अगर कारें हमसे गाड़ी चलाना सीख रही हैं, तो ज़ाहिर है वे हमारी बुरी आदतें भी अपनाएंगी। तो तैयार रहिए, भविष्य में ऐसी सेल्फ-ड्राइविंग कारें दिख सकती हैं जो आपको अचानक ‘कट’ मारें, पैसिव-अग्रेसिव तरीके से लेन बदलें, या शायद कभी-कभार AI-पावर्ड ‘रोड रेज’ का नमूना भी पेश करें।

और सबसे मज़ेदार बात? ज़रा सोचिए अगर इन कारों को ज़रूरत से ज़्यादा ‘संस्कारी’ और विनम्र बना दिया गया। वे हर पैदल चलने वाले के सामने रुक जाएंगी और हर दूसरी कार को पहले निकलने का रास्ता देंगी। नतीजा? ट्रैफिक पूरी तरह ठप हो जाएगा क्योंकि ये अति-विनम्र कारें सड़क पर “पहले आप, नहीं पहले आप” के कभी न खत्म होने वाले लूप में फंसी रहेंगी।

भविष्य (उम्मीद है) कम झटकों वाला होगा

बेशक, अभी एक लंबा रास्ता तय करना बाकी है। जैसा कि खुद शोधकर्ताओं ने बताया है, टेस्टिंग के दौरान AI ने जो नियम तोड़े, उनमें से कई तो सिम्युलेटर की अपनी कमियों की वजह से थे—जैसे कि पैदल चलने वालों का बिना देखे अचानक सड़क पर आ जाना। लेकिन यह तथ्य कि सेल्फ-ड्राइविंग कारें ‘सेल्फ-प्ले’ के ज़रिए जटिल और अप्रत्याशित माहौल में चलना सीख सकती हैं, अपने आप में एक बड़ी छलांग है।

तो अगली बार जब आप सड़क पर किसी सेल्फ-ड्राइविंग कार को देखें, तो याद रखिएगा कि उसने अपनी ‘डिजिटल ज़िंदगी’ में आपसे कहीं ज़्यादा ट्रैफिक जाम और एक्सीडेंट्स झेले हैं। और अगर वह आपको कट मार दे, तो बस इतना समझ लीजिएगा: वह शायद हम इंसानों में से ही किसी ‘बेहतरीन’ (या सबसे खराब) ड्राइवर से सीख रही है।

संपादकीय नोट: इस AI सिस्टम को बनाने में किसी भी असली कार को नुकसान नहीं पहुँचाया गया है। 
हालाँकि, कुछ वर्चुअल कारों का दफ्तर में दिन काफी खराब गुज़रा।

स्रोत: Robust Autonomy Emerges from Self-Play