इंसान बनाम यूट्यूब: रोबोट ट्रेनिंग की महाजंग और स्केलिंग का संकट

एक काबिल ह्युमनॉइड रोबोट (humanoid robot) बनाने की रेस अब सिर्फ पुर्जों और हार्डवेयर की नहीं रह गई है, बल्कि यह एक बुनियादी दार्शनिक सवाल में बदल चुकी है: आखिर एक मशीन को सिखाने का सबसे सटीक तरीका क्या है? एक तरफ Sunday जैसी कंपनियां हैं, जो इंसानी ‘उस्तादों’ की एक पूरी फौज पर दांव लगा रही हैं। वहीं दूसरी तरफ, Tesla और Nvidia जैसे दिग्गज इस उम्मीद में हैं कि उनके रोबोट सिर्फ YouTube वीडियो देखकर ही सब कुछ सीख जाएंगे। रोबोटिक्स के क्षेत्र में यह रणनीतिक मतभेद इस समय सबसे बड़ी चर्चा का विषय है, और फिलहाल किसी के पास भी इसका कोई एक मुकम्मल जवाब नहीं है।

Sunday पूरी तरह से ‘इमिटेशन लर्निंग’ (imitation learning) के रास्ते पर चल रही है। इन्होंने 500 “मेमोरी डेवलपर्स” (memory developers) को खास तरह के सेंसरी ग्लव्स से लैस किया है, ताकि वे रोज़मर्रा के हर मुमकिन काम का बारीकी से हाई-क्वालिटी डेटा रिकॉर्ड कर सकें। कंपनी का दावा है कि इस पद्धति की बदौलत वे हर एक से दो हफ्ते के भीतर रोबोट को एक नया टास्क सिखाने और उसे परखने में सक्षम हैं। वे इसे “दुनिया का सबसे तेज़ी से सीखने वाला रोबोट” कह रहे हैं। डेटा कलेक्शन का यह तरीका किसी ‘हस्तशिल्प’ जैसा है, जहाँ संख्या से कहीं ज़्यादा डेटा की गुणवत्ता (quality) पर ज़ोर दिया जा रहा है।

Video thumbnail

इंसान को केंद्र में रखकर बनाई गई इस ट्रेनिंग पद्धति के और भी रूप हैं। नॉर्वे की कंपनी 1X Technologies भी इंसानी गाइडेंस का ही सहारा लेती है, लेकिन वे क्यूरेटेड सेशन के बजाय अपने 1X Neo: आ गया आपका AI बटलर, लेकिन क्या आप इसकी कीमत चुका पाएंगे? रोबोट्स को सीधे असली दुनिया के हालातों में उतार देते हैं, जहाँ वे ‘टेलिऑपरेशन’ (teleoperation) के ज़रिए सीखते हैं। यह किसी क्लासरूम की पढ़ाई जैसा नहीं, बल्कि काम करते-करते सीखने वाली ‘इंटर्नशिप’ जैसा है। वहीं, Figure जैसी कंपनियां फिजिकल “Neura Gyms” तैयार कर रही हैं—ये ऐसे नियंत्रित वातावरण हैं जहाँ रोबोट्स को BMW जैसी कंपनियों के साथ मिलकर खास कामों की ट्रेनिंग दी जाती है।

इसके उलट, एक दूसरा खेमा है जो “सिर्फ वीडियो देखकर सीखने” पर भरोसा करता है। Tesla के मुखिया एलन मस्क कई बार कह चुके हैं कि उनका लक्ष्य Optimus बॉट को इतना काबिल बनाना है कि वह इंसानों के वीडियो देखकर ही उनके काम की नकल कर सके। Nvidia भी अपने NVIDIA Cosmos: रोबोट्स के लिए तैयार हो रहा है हाई-टेक 'मैट्रिक्स' प्लेटफॉर्म के साथ सिमुलेशन और इंटरनेट पर मौजूद अरबों वीडियो डेटा का इस्तेमाल करके रोबोटिक्स के लिए ‘फाउंडेशन मॉडल’ तैयार कर रही है। यह तरीका ‘स्केल’ के मामले में बेजोड़ है—इंटरनेट पर “how-to” वीडियो की इतनी भरमार है कि कोई भी इंसानी टीम उतनी जानकारी कभी पैदा नहीं कर सकती। हालांकि, इस तरीके के साथ सबसे बड़ी चुनौती सही संदर्भ (context) को समझने और इंटरनेट के कचरा डेटा (unstructured data) से पार पाने की है।

यह इतना महत्वपूर्ण क्यों है?

ट्रेनिंग के तरीकों में यह वैचारिक मतभेद एक ‘जनरल-पर्पस’ रोबोट बनाने की राह का सबसे बड़ा रोड़ा है। इस पूरी बहस की जड़ ‘क्वालिटी बनाम क्वांटिटी’ की उस पुरानी पहेली में छिपी है, जिसे मशीनी तालमेल और भौतिक दुनिया की जटिलताओं ने और पेचीदा बना दिया है।

क्या इंसानी उस्तादों द्वारा तैयार किया गया सटीक और हाई-क्वालिटी डेटा—जैसा कि Sunday AI: रोबोट अब कठपुतली नहीं, सीधे हाथ से सीखेंगे काम बना रहा है—रोबोट को भरोसेमंद बनाने की चाबी साबित होगा? या फिर इंटरनेट पर मौजूद डेटा का वह विशाल और बेतरतीब समंदर ही भविष्य की रोबोटिक इंटेलिजेंस का रास्ता खोलेगा, जैसा कि Tesla और Nvidia का मानना है? जो भी कंपनी सीखने की इस गुत्थी को सुलझा लेगी, वह सिर्फ एक बेहतर रोबोट ही नहीं बनाएगी, बल्कि अगले दशक के आर्टिफिशियल इंटेलिजेंस और ऑटोमेशन की तकदीर भी लिखेगी।