टेनिस रोबोट: खराब डेटा से सीखा और अपने मेकर को ही हरा दिया

जब चेला निकला गुरु से भी आगे: इस रोबोट ने टेनिस में अपने ही उस्ताद को चटाई धूल। जो लोग टेक जगत की हलचलों पर पैनी नजर रखते हैं, उनके लिए यह खबर शायद चौंकाने वाली न हो, लेकिन एक रिसर्चर ने एक ऐसा रोबोट विकसित किया है जिसने एक नया हुनर इतनी बखूबी सीखा कि उसने खेल के मैदान में अपने ही कोच को मात दे दी। खेल था टेनिस, और इस प्रोजेक्ट का नाम है LATENT। इस ह्युमनॉइड (इंसान जैसा दिखने वाला रोबोट) को किसी प्रोफेशनल खिलाड़ी के ‘परफेक्ट’ डेटा से नहीं, बल्कि इंसानों के उन टूटे-फूटे और अधूरे मोशन क्लिप्स से ट्रेनिंग दी गई थी, जिन्हें हम अक्सर ‘इम्पर्फेक्ट’ मानकर छोड़ देते हैं। नतीजा यह है कि अब यह रोबोट मैदान पर प्रोफेशनल खिलाड़ियों की तरह लंबी रैलियों में डटा रहता है।

Tsinghua University और Galbot Inc. के रिसर्चर्स के नेतृत्व में चल रहे इस प्रोजेक्ट ने रोबोटिक्स की एक सबसे बड़ी चुनौती को निशाने पर लिया है: बिना किसी सटीक ‘इंस्ट्रक्शन मैनुअल’ के रोबोट को जटिल और फुर्तीले मूवमेंट्स सिखाना। इनका सिस्टम इंसानी टेनिस मूवमेंट्स के बिखरे हुए हिस्सों से एक “latent action space” तैयार करता है। इस पूरी प्रक्रिया का ‘सीक्रेट सॉस’ एक हाई-लेवल AI पॉलिसी है, जो किसी डिजिटल कोच की तरह काम करती है। यह AI उन खामियों वाले बेसिक स्किल्स को न सिर्फ सुधारता है, बल्कि उन्हें आपस में जोड़कर रोबोट को इस काबिल बनाता है कि वह गेंद को सटीकता के साथ नेट के पार पहुंचा सके। इस पूरी ट्रेनिंग को पहले सिमुलेशन (डिजिटल वातावरण) में तराशा गया और फिर ‘sim-to-real transfer’ तकनीक के जरिए इसे एक असली Unitree G1 ह्युमनॉइड रोबोट में उतारा गया।

A diagram showing the four-stage process of the LATENT system: Motion Tracker Pre-training, Online Distillation, High-Level Policy Learning, and Sim-to-Real Transfer.

कहते हैं न, ‘प्रत्यक्ष को प्रमाण की क्या आवश्यकता’, और इसका सबूत स्कोरबोर्ड पर साफ दिखता है। इस प्रोजेक्ट के लीड ऑथर Zhikai Zhang के अनुसार, रोबोट के सीखने की रफ़्तार वाकई हैरतअंगेज थी। झांग बताते हैं, “असली दुनिया में टेस्टिंग के पहले दिन, रोबोट मेरी एक भी सर्विस रिटर्न नहीं कर पा रहा था। लेकिन प्रोजेक्ट के आखिरी दिन तक आते-आते, पासा पूरी तरह पलट चुका था और मैं उसे हराने में नाकाम साबित हो रहा था।” अगर आप भी इस तकनीकी बारीकी को समझना चाहते हैं या अपना खुद का टेनिस चैंपियन रोबोट तैयार करने की सोच रहे हैं, तो टीम ने प्रोजेक्ट की डिटेल्स और कोड सार्वजनिक कर दिए हैं। हाइपरलिंक: Project Page और हाइपरलिंक: GitHub Repository

यह इतना महत्वपूर्ण क्यों है?

यह सिर्फ अकेले टेनिस खेलने वालों के लिए एक रोबोटिक पार्टनर बनाने भर की बात नहीं है। LATENT सिस्टम की असली कामयाबी यह है कि यह ‘मेसी’ (अव्यवस्थित) और अधूरे डेटा से भी काम की चीजें सीख सकता है। आमतौर पर रोबोट्स की ट्रेनिंग के लिए बहुत ही सटीक और महंगे डेटासेट्स की जरूरत होती है, जिन्हें तैयार करना टेढ़ी खीर है। गलतियों से भरे उदाहरणों को सुधारकर और उन्हें जोड़कर सीखने का यह तरीका रोबोटिक्स की दुनिया में एक बड़ा ‘गेम-चेंजर’ साबित हो सकता है। यह उन रोबोट्स की दिशा में एक क्रांतिकारी कदम है जो वेयरहाउस से लेकर आपदा क्षेत्रों (disaster zones) जैसे अनिश्चित माहौल में काम करते हुए खुद को ढाल सकेंगे, और उन्हें हर बार किसी ‘परफेक्ट’ डेमो की जरूरत नहीं होगी।