रोबोटिक क्रांति अब ओपन सोर्स है: NVIDIA के GR00T N1 ने रखा ‘जनरलिस्ट रोबोटिक्स’ के युग में कदम
सैन जोस के विशाल SAP सेंटर में, जहां हजारों डेवलपर्स और टेक दिग्गजों के बीच जबरदस्त उत्साह और इंतजार का माहौल था, NVIDIA के CEO Jensen Huang अपनी सिग्नेचर लेदर जैकेट में मंच पर आए। एक नाटकीय ठहराव के बाद उन्होंने घोषणा की, “जनरलिस्ट रोबोटिक्स (Generalist Robotics) का युग आ चुका है।” मंगलवार को NVIDIA की GTC 2025 कॉन्फ्रेंस में की गई यह घोषणा महज एक बयान नहीं थी—यह रोबोटिक्स की दुनिया के ‘एंड्रॉइड मोमेंट’ का आगाज़ था: NVIDIA Isaac GR00T N1, दुनिया का पहला ओपन ह्यूमनॉइड रोबोट फाउंडेशन मॉडल।
हर शरीर के लिए एक दिमाग: रोबोटिक इंटेलिजेंस का लोकतांत्रीकरण
आज की सुर्खियों में छाए रहने वाले बंद (proprietary) AI सिस्टम के ठीक उलट, GR00T N1 रोबोटिक इंटेलिजेंस के लिए एक बिल्कुल अलग नजरिया पेश करता है। यह एक ऐसा विज़न है जो खुलेपन (openness), सुलभता और रोबोट्स की उस क्षमता पर आधारित है जहां वे बिना किसी विशेष प्रोग्रामिंग के अलग-अलग वातावरण और कार्यों में खुद को ढाल सकें।
दो घंटे से अधिक समय तक चले अपने कीनोट में Jensen Huang ने खचाखच भरे एरिना को संबोधित करते हुए कहा, “NVIDIA Isaac GR00T N1 और नए डेटा-जेनरेशन और रोबोट-लर्निंग फ्रेमवर्क के साथ, दुनिया भर के रोबोटिक्स डेवलपर्स AI के युग में एक नई सीमा को फतह करेंगे।” यह बयान NVIDIA की उस महत्वाकांक्षी रणनीति को दर्शाता है जिसके तहत वे अगली पीढ़ी के ह्यूमनॉइड रोबोट्स को चलाने वाली इंटेलिजेंस तैयार करना चाहते हैं और फिर उसे दुनिया भर के डेवलपर्स के लिए मुफ्त में उपलब्ध कराना चाहते हैं।
यह घोषणा इसलिए भी महत्वपूर्ण है क्योंकि यह रोबोटिक्स की सबसे बड़ी चुनौती—ट्रेनिंग डेटा की कमी—का समाधान करती है। NVIDIA के सीनियर रिसर्च मैनेजर और Embodied AI के लीड, Jim Fan ने कीनोट के बाद एक लिंक्डइन पोस्ट में समझाया: “हम फिजिकल AI (Physical AI) के लोकतांत्रीकरण के मिशन पर हैं। एक जनरल रोबोट ब्रेन की शक्ति अब आपकी मुट्ठी में है—सिर्फ 2 बिलियन पैरामीटर्स के साथ, N1 अब तक के सबसे विविध फिजिकल एक्शन डेटासेट से सीखता है और अपनी क्षमता से कहीं ज्यादा बड़े परिणाम देता है।”
तेज़ और गहरी सोच वाला रोबोट
GR00T N1 के केंद्र में मानव संज्ञान (human cognition) से प्रेरित एक ‘डुअल-सिस्टम’ आर्किटेक्चर है—जिसे NVIDIA “तेज़ और धीमी सोच” (thinking fast and slow) कहता है। यह दृष्टिकोण उन कॉग्निटिव साइंस थ्योरीज से लिया गया है जो मानव सोच को दो हिस्सों में बांटती हैं: सहज और स्वचालित प्रतिक्रियाएं (intuitive responses), और सोच-समझकर की गई तर्कसंगत विवेचना (methodical reasoning)।
“सिस्टम 2,” यानी धीमी सोच वाला हिस्सा, रोबोट के वातावरण और उसे मिलने वाले निर्देशों को समझने के लिए विज़न लैंग्वेज मॉडल का उपयोग करता है और फिर उचित कार्रवाई की योजना बनाता है। “सिस्टम 1,” यानी तेज़ सोच वाला हिस्सा, इन योजनाओं को 120Hz की रफ़्तार पर सटीक और निरंतर रोबोटिक मूवमेंट में बदल देता है। यह आर्किटेक्चर रोबोट्स को उन जटिल कार्यों को करने की अनुमति देता है जिनमें गहरी सोच और फुर्तीले मूवमेंट दोनों की जरूरत होती है—जैसे चीजों को उठाना, एक या दोनों हाथों से उनका इस्तेमाल करना और कई चरणों वाले काम पूरे करना।
मंच पर एक प्रदर्शन के दौरान, जिसने दर्शकों को रोमांचित कर दिया, Jensen Huang ने 1X के Neo ह्यूमनॉइड रोबोट को GR00T N1 पर आधारित पॉलिसी का उपयोग करके घर की सफाई करते हुए दिखाया। रोबोट के लचीले मूवमेंट और अपने परिवेश की गहरी समझ ने इस मॉडल की व्यावहारिक क्षमताओं को साबित कर दिया।
सिंथेटिक रियलिटी से डेटा की दीवार को तोड़ना
NVIDIA के इस दृष्टिकोण का सबसे क्रांतिकारी पहलू यह है कि यह रोबोटिक्स की बुनियादी डेटा समस्या को कैसे हल करता है। जहां लैंग्वेज मॉडल्स को इंटरनेट पर मौजूद विशाल टेक्स्ट डेटा से ट्रेन किया जा सकता है, वहीं रोबोट लर्निंग अब तक भौतिक दुनिया की सीमाओं में कैद थी—एक इंसान दिन में केवल 24 घंटे का ही ट्रेनिंग डेटा तैयार कर सकता है।
NVIDIA के GR00T N1 इंट्रो वीडियो में बताया गया, “इंसानी प्रदर्शन का डेटा दिन के घंटों तक ही सीमित है।” इस बाधा को दूर करने के लिए, NVIDIA ने ऐसे फ्रेमवर्क विकसित किए हैं जो वास्तविक दुनिया के प्रदर्शनों को बड़े पैमाने पर सिंथेटिक डेटासेट में बदल सकते हैं।
NVIDIA Isaac GR00T Blueprint के शुरुआती घटकों का उपयोग करते हुए, कंपनी ने केवल 11 घंटों में 7,80,000 सिंथेटिक ट्रेजेक्टरीज (synthetic trajectories) तैयार कीं—जो नौ महीने के निरंतर मानव प्रदर्शन डेटा के बराबर है। जब इसे वास्तविक डेटा के साथ मिलाया गया, तो इस सिंथेटिक डेटासेट ने GR00T N1 के प्रदर्शन में केवल वास्तविक डेटा के मुकाबले 40% का सुधार किया।
यह दृष्टिकोण तीन डेटा स्रोतों का उपयोग करता है: वास्तविक ह्यूमनॉइड टेलीऑपरेशन डेटा (Apple Vision Pro जैसे सिस्टम का उपयोग करके एकत्र किया गया), बड़े पैमाने पर सिमुलेशन डेटा (जिसे NVIDIA 3,00,000 से अधिक ट्रेजेक्टरीज के साथ ओपन-सोर्स कर रहा है), और जिसे Jim Fan “न्यूरल ट्रेजेक्टरीज” (neural trajectories) कहते हैं—यानी अत्याधुनिक वीडियो जेनरेशन मॉडल्स का उपयोग करके सटीक फिजिक्स के साथ नए सिंथेटिक डेटा की कल्पना करना।
Jim Fan ने अपनी पोस्ट में Jensen Huang के शब्दों को दोहराते हुए लिखा, “सिस्टमैटिकली इनफिनिट डेटा (Systematically infinite data)!”
स्टार वार्स वाला पल: ‘ब्लू’ ने लूटी महफिल
एक ऐसे पल में जब दर्शक अपने फोन निकाल कर वीडियो बनाने लगे, Jensen Huang ने “Blue” को पेश किया—एक बेहद करिश्माई रोबोट जो बिल्कुल किसी ‘स्टार वार्स’ फिल्म के किरदार जैसा दिखता है। यह दो पैरों वाला ड्रॉयड, जो R2-D2 की याद दिलाता है लेकिन जिसकी अपनी एक अलग शख्सियत है, Jensen Huang के इर्द-गिर्द घूमा, बीप की आवाज़ें निकालीं और दर्शकों के अभिवादन में अपना सिर हिलाया।
“सच कहिए, क्या यह कमाल नहीं था?” Jensen Huang ने तालियों की गड़गड़ाहट के बीच कहा। यह रोबोट सिर्फ दिखावे के लिए नहीं था—इसने Google DeepMind और Disney Research के साथ NVIDIA की नई साझेदारी का प्रदर्शन किया, जिसका उद्देश्य ‘Newton’ नामक एक नया ओपन-सोर्स फिजिक्स इंजन बनाना है।
Jensen Huang ने समझाया, “हमें एक ऐसे फिजिक्स इंजन की जरूरत है जो बहुत सूक्ष्म, कठोर और नरम निकायों (rigid and soft bodies) के लिए डिज़ाइन किया गया हो, जिसे स्पर्श प्रतिक्रिया (tactile feedback), सूक्ष्म मोटर कौशल और एक्चुएटर कंट्रोल को ट्रेन करने के लिए बनाया गया हो।” NVIDIA Warp फ्रेमवर्क पर आधारित Newton इंजन, रोबोट लर्निंग के लिए ऑप्टिमाइज़ किया जाएगा और Google DeepMind के MuJoCo और NVIDIA Isaac Lab जैसे सिमुलेशन फ्रेमवर्क के साथ काम करेगा।
Walt Disney Imagineering R&D के सीनियर वाइस प्रेसिडेंट Kyle Laughlin ने डिज्नी की भागीदारी पर कहा, “BDX ड्रॉयड्स तो बस शुरुआत हैं। हम और अधिक किरदारों को ऐसी दुनिया में लाने के लिए प्रतिबद्ध हैं जैसा पहले कभी नहीं देखा गया।”
10 ट्रिलियन डॉलर का अवसर
इस रोबोटिक क्रांति में दांव बहुत ऊंचे हैं। Jensen Huang ने रोबोटिक्स को “अगला 10 ट्रिलियन डॉलर का उद्योग” बताया, जो दुनिया भर में 50 मिलियन से अधिक लोगों की लेबर शॉर्टेज (श्रम की कमी) को दूर करने में सक्षम होगा।
ह्यूमनॉइड रोबोट विकसित करने वाली कंपनियों के लिए, GR00T N1 एक बहुत बड़ी बढ़त प्रदान करता है। रोबोटिक इंटेलिजेंस को शून्य से बनाने के बजाय, डेवलपर्स NVIDIA के फाउंडेशन मॉडल का लाभ उठा सकते हैं और पोस्ट-ट्रेनिंग के माध्यम से इसे विशिष्ट रोबोट्स या कार्यों के लिए कस्टमाइज़ कर सकते हैं।
1X Technologies के CEO Bernt Børnich, जो GR00T N1 का उपयोग करने वाले शुरुआती पार्टनर्स में से एक हैं, ने इस लाभ पर जोर दिया: “NVIDIA का GR00T N1 मॉडल रोबोटिक तर्क और कौशल के लिए एक बड़ी सफलता है। बहुत कम पोस्ट-ट्रेनिंग डेटा के साथ, हम NEO Gamma पर इसे पूरी तरह से तैनात करने में सक्षम रहे।”
शुरुआती पहुंच पाने वाले अन्य प्रमुख डेवलपर्स में Agility Robotics, Boston Dynamics, Mentee Robotics और NEURA Robotics शामिल हैं।
क्रॉस-एम्बॉडीमेंट: एक अनपेक्षित मोड़
हालांकि GR00T N1 का मुख्य फोकस ह्यूमनॉइड रोबोट्स पर है, लेकिन Jim Fan ने एक दिलचस्प क्षमता का खुलासा किया: क्रॉस-एम्बॉडीमेंट सपोर्ट। उन्होंने लिखा, “हमने इसे $110 के HuggingFace LeRobot SO100 रोबोट आर्म पर काम करने के लिए भी फाइन-ट्यून किया है!” यह साबित करता है कि इस फाउंडेशन मॉडल का लाभ महंगे ह्यूमनॉइड प्लेटफॉर्म से लेकर सस्ते हार्डवेयर तक सबको मिल सकता है।

Jim Fan ने उत्साह के साथ निष्कर्ष निकाला: “ओपन रोबोट ब्रेन, ओपन हार्डवेयर पर चलता है। यह बिल्कुल सही लगता है। चलिए साथ मिलकर रोबोटिक्स की गुत्थी सुलझाते हैं, एक समय में एक टोकन के साथ।”
आगे की राह
GR00T N1 मॉडल, ट्रेनिंग डेटा और टास्क इवैल्यूएशन सिनेरियो अब Hugging Face और GitHub पर उपलब्ध हैं। इसके साथ ही, सिंथेटिक मोशन जेनरेशन के लिए NVIDIA Isaac GR00T Blueprint भी build.nvidia.com पर एक इंटरैक्टिव डेमो के रूप में उपलब्ध है।
इन मॉडल्स के साथ काम करने के इच्छुक डेवलपर्स के लिए, NVIDIA ने DGX Spark पर्सनल AI सुपरकंप्यूटर की भी घोषणा की है, जो नए रोबोट्स, कार्यों और वातावरण के लिए GR00T N1 की क्षमताओं का विस्तार करने के लिए एक तैयार सिस्टम (turnkey system) प्रदान करता है।
Newton फिजिक्स इंजन के इस साल के अंत तक उपलब्ध होने की उम्मीद है, जो रोबोटिक्स डेवलपर्स के टूलसेट को और विस्तार देगा।
फिजिकल AI का लोकतांत्रीकरण
NVIDIA के इस कदम को जो चीज़ सबसे अलग बनाती है, वह है इसका खुलापन और सुलभता। GR00T N1 और इससे जुड़े टूल्स को व्यापक रूप से उपलब्ध कराकर, NVIDIA खुद को रोबोटिक इंटेलिजेंस के एकमात्र निर्माता के रूप में नहीं, बल्कि उस बुनियादी परत (foundation layer) के रूप में स्थापित कर रहा है जिस पर दुनिया भर के डेवलपर्स इनोवेशन कर सकें।
जैसे-जैसे रोबोटिक्स विशेष औद्योगिक उपयोगों से निकलकर सामान्य कार्यों की ओर बढ़ रहा है, NVIDIA का यह ओपन अप्रोच इनोवेशन की रफ़्तार को उसी तरह तेज कर सकता है जैसे ओपन-सोर्स सॉफ्टवेयर ने कंप्यूटिंग की दुनिया को बदल दिया था। वह कंपनी जिसने गेमिंग के लिए ग्राफिक्स प्रोसेसिंग से अपनी पहचान बनाई थी, अब एक ऐसे भविष्य की नींव रख रही है जहां इंटेलिजेंट रोबोट उतने ही आम होंगे जितने आज स्मार्टफोन हैं।
रोबोटिक्स कम्युनिटी में GR00T N1 को लेकर उत्साह तो है, लेकिन रोबोट हार्डवेयर की वर्तमान सीमाओं को लेकर कुछ संदेह भी बना हुआ है। जैसा कि एक रोबोटिक्स कंपनी के संस्थापक ने कहा, “यह सब तब ठीक होता जब रोबोट हार्डवेयर इंसानों के बराबर होता। फिलहाल रोबोट्स इंसानों के मुकाबले काफी भारी और अनाड़ी हैं।”
बहरहाल, NVIDIA का विज़न स्पष्ट है: यदि रोबोट्स को मानव जीवन के अनगिनत परिदृश्यों में वास्तव में बहुमुखी और उपयोगी बनना है, तो उन्हें एक ऐसी ‘जनरलिस्ट इंटेलिजेंस’ की आवश्यकता है जो नए वातावरण और कार्यों के लिए खुद को तुरंत ढाल सके। GR00T N1 के साथ, वह भविष्य अब एक बड़ा कदम और करीब आ गया है।
“जनरलिस्ट रोबोटिक्स का युग आ चुका है,” Jensen Huang ने घोषणा की। एक ऐसा क्षेत्र जिसने अक्सर वादे तो बड़े किए लेकिन परिणाम कम दिए, वहां NVIDIA का यह व्यवस्थित दृष्टिकोण—फाउंडेशन मॉडल, सिंथेटिक डेटा जेनरेशन और ओपन कोलैबोरेशन का संगम—शायद इस घोषणा को हकीकत में बदलने का सबसे विश्वसनीय रास्ता है।













