Generalist का GEN-1 रोबोट ब्रेन: 99% सफलता और 3x रफ़्तार!

सच कहें तो, रोबोटिक्स के ज़्यादातर डेमो किसी बोरिंग और धीमी गति वाले नाटक जैसे होते हैं। उनकी अटपटी और सुस्त चालें देखकर अक्सर ऐसा लगता है कि शायद दुनिया का अंत पहले हो जाएगा और उनका काम बाद में खत्म होगा। लेकिन कभी-कभी कुछ ऐसा सामने आता है जो सारी पुरानी धारणाओं को तोड़ देता है। आज वह ‘धमाका’ किया है Generalist के नए AI मॉडल, GEN-1 ने। कंपनी का दावा काफी साहसी है: रोबोट्स के लिए एक ऐसा जनरल-पर्पस ‘दिमाग’ जो सिर्फ काम नहीं करता, बल्कि उसमें महारत रखता है।

Generalist का कहना है कि GEN-1 पहला ऐसा मॉडल है जिसने बुनियादी फिजिकल टास्क (शारीरिक कार्यों) में सच में ‘मास्टरी’ हासिल कर ली है, और वे इसे ठोस आंकड़ों के साथ साबित भी कर रहे हैं। हम यहाँ 99% की औसत सक्सेस रेट की बात कर रहे हैं, जबकि इसका पिछला वर्जन GEN-0 महज 64% (एक तरह से B-minus ग्रेड) पर ही सिमट गया था। इतना ही नहीं, यह पुराने मॉडल्स के मुकाबले तीन गुना तेज़ी से काम पूरा करता है और सबसे बड़ी बात—इसे कोई भी नया काम सिखाने के लिए केवल एक घंटे का रोबोट-स्पेसिफिक डेटा चाहिए। यह सिर्फ एक छोटा-मोटा अपडेट नहीं है; यह उस भविष्य की ओर एक बड़ी छलांग है जहाँ रोबोट्स आखिरकार कमर्शियल तौर पर इस्तेमाल के लायक बन पाएंगे।

स्केलिंग लॉ से फिजिकल मास्टरी तक

अभी पाँच महीने पहले ही Generalist ने GEN-0 पेश किया था। उस मॉडल ने पहली बार यह साबित किया था कि जिस ‘Scaling Laws’ की बदौलत GPT जैसे LLMs ने दुनिया में तहलका मचाया है, वही नियम रोबोटिक्स पर भी लागू होते हैं। यानी जितना ज़्यादा डेटा और जितनी ज़्यादा कंप्यूटिंग पावर, उतना ही बेहतर परफॉर्मेंस। यह थ्योरी के हिसाब से तो बड़ी बात थी, लेकिन GEN-0 असल दुनिया की भागदौड़ के लिए पूरी तरह तैयार नहीं था।

GEN-1 उसी फॉर्मूले को अगले लेवल पर ले जाने का नतीजा है। इसे बहुत बड़े डेटासेट पर ट्रेन किया गया है—अब इसमें 5 लाख घंटों से ज़्यादा का हाई-फिडेलिटी फिजिकल इंटरैक्शन डेटा शामिल है। लेकिन इसकी असली ताकत इसके डेटा सोर्स में छिपी है। महंगे और मुश्किल ‘टेली-ऑपरेशन’ (रिमोट कंट्रोल) डेटा के बजाय, GEN-1 की नींव इंसानों द्वारा पहने जाने वाले सस्ते वियरेबल डिवाइसेस से मिले डेटा पर टिकी है। इससे मॉडल को असली दुनिया की फिजिक्स और उन बारीक सुधारों (micro-corrections) की गहरी समझ मिली है, जो अक्सर सिमुलेशन में छूट जाते हैं।

कंपनी ने अपने ऐलान में कहा, “हमारा मानना है कि GEN-1 पहला ऐसा जनरल फिजिकल AI मॉडल है जिसने उस लक्ष्मण रेखा को पार कर लिया है, जहाँ से रोबोट्स का व्यावसायिक इस्तेमाल (commercial viability) मुमकिन हो जाता है।”

A robotic arm meticulously packing a smartphone into a box, demonstrating high-speed precision.

तीन स्तंभ: विश्वसनीयता, रफ्तार और सूझबूझ

Generalist के लिए ‘महारत’ का मतलब तीन खूबियों का संगम है। इनमें से दो तो पिछले 60 सालों से इंडस्ट्रियल ऑटोमेशन की जान रही हैं, लेकिन तीसरी खूबी ही असली गेम-चेंजर है।

विश्वसनीयता और रफ्तार: पुरानी नींव, नई ताकत

सबसे पहले आंकड़े देखिए, जो वाकई हैरान करने वाले हैं। लंबे समय तक चले टेस्ट्स में, GEN-1 ने लगातार 1,800 बार ब्लॉक्स पैक किए, 200 से ज़्यादा बार बॉक्स फोल्ड किए और यहाँ तक कि एक रोबोटिक वैक्यूम क्लीनर की 200 बार सर्विस की—एक रोबोट दूसरे रोबोट की देखभाल कर रहा है, यह या तो किसी सुनहरे भविष्य का सपना है या फिर किसी साइ-फाई हॉरर फिल्म की शुरुआत! ये काम घंटों तक बिना किसी मानवीय दखल के 99% सटीकता के साथ चलते रहे।

अब बात करते हैं रफ्तार की। GEN-1 से लैस रोबोट एक बॉक्स को महज 12.1 सेकंड में असेंबल कर सकता है, जबकि पुराने मॉडल को इसमें 34 सेकंड लगते थे। फोन को केस में पैक करने का काम अब 15.5 सेकंड में हो जाता है, जो पहले से 2.8 गुना तेज़ है। यह सिर्फ मोटरों की स्पीड बढ़ाने का मामला नहीं है; मॉडल अपने अनुभव से सीखता है और इंसानी डेमो से भी ज़्यादा कुशलता से काम करने के तरीके ढूंढ निकालता है।

Video thumbnail

सूझबूझ: बुद्धिमत्ता की असली चमक

इंडस्ट्रियल रोबोट्स जो फैक्ट्री की ज़मीन पर फिक्स होते हैं, वे तेज़ और भरोसेमंद तो होते हैं, लेकिन उनके पास ‘दिमाग’ नहीं होता। अगर हालात ज़रा भी बदलें, तो वे फेल हो जाते हैं। यहीं पर GEN-1 की “इम्प्रोवाइज़ेशनल इंटेलिजेंस” (हाजिरजवाबी) काम आती है।

Generalist इसे एक ‘इमर्जेंट कैपेबिलिटी’ कहता है—यानी समस्याओं को मौके पर ही सुलझाने की कला। एक डेमो में, ऑटोमोटिव पार्ट्स को किट में रखते समय रोबोट से गलती से एक वॉशर टकरा जाता है। यहाँ रोबोट रुकता नहीं और न ही क्रैश होता है, बल्कि GEN-1 सिस्टम हालात का जायजा लेकर खुद को ढाल लेता है। वह वॉशर को वापस सही से पकड़ने के लिए नीचे रख सकता है, या उसे सही दिशा में घुमाने के लिए किसी किनारे का सहारा ले सकता है। ये कोई पहले से फीड किए गए ‘रिकवरी प्रोग्राम’ नहीं हैं, बल्कि मौके पर पैदा हुए नए समाधान हैं। यही ऑटोमेशन और असली ऑटोनॉमी (स्वायत्तता) के बीच का अंतर है।

सिर्फ एक मॉडल नहीं, एक पूरा सिस्टम

यह समझना ज़रूरी है कि GEN-1 सिर्फ कुछ कोड्स या वेट्स का सेट नहीं है। यह एक पूरा इकोसिस्टम है जिसमें प्री-ट्रेनिंग, पोस्ट-ट्रेनिंग और इन्फरेंस-टाइम प्रोसेसिंग की नई तकनीकें शामिल हैं। यही वजह है कि यह इतना डेटा-एफिशिएंट है—सिर्फ एक घंटे के नए डेटा के साथ यह एक नए रोबोटिक शरीर और नए काम, दोनों के साथ तालमेल बिठा लेता है।

A robot arm servicing a robot vacuum cleaner, showcasing complex interaction between two machines.

बेशक, GEN-1 फिजिकल AGI (आर्टिफिशियल जनरल इंटेलिजेंस) के लिए कोई ‘रामबाण’ नहीं है। कंपनी खुद इसकी सीमाओं को स्वीकार करती है। हर काम में 99% सफलता नहीं मिलती, और कुछ इंडस्ट्रीज़ को इससे भी कहीं ज़्यादा भरोसेमंद सिस्टम चाहिए। इसके अलावा, रोबोट की अपनी मर्जी से ‘जुगाड़’ करने की क्षमता AI एलाइनमेंट के गंभीर सवाल भी खड़े करती है। एक रोबोट जो रचनात्मक तरीके से समस्या सुलझा सके वह शानदार है, लेकिन आपको यह भी सुनिश्चित करना होगा कि उसकी ‘रचनात्मकता’ में काम जल्दी निपटाने के चक्कर में दीवार में छेद करना शामिल न हो!

A pair of robotic arms working in tandem to fold a t-shirt, a classic challenge in dexterous manipulation.

फिर भी, GEN-1 की लॉन्चिंग एक ऐतिहासिक मोड़ जैसा महसूस होती है। यह इस बात को पुख्ता करता है कि रोबोट्स को असली दुनिया के डेटा से ट्रेन करना ही उन्हें समझदार बनाने का सबसे सही रास्ता है। सही ढंग से काम करना, तेज़ी से करना और गड़बड़ होने पर खुद को संभाल लेना—इन तीन मोर्चों पर ध्यान देकर Generalist ने उस सपने को हकीकत के करीब ला दिया है जहाँ जनरल-पर्पस रोबोट्स हमारे काम आसान करेंगे। हमारे लिए यह सिर्फ एक मॉडल नहीं, बल्कि एक संकेत है कि भौतिक दुनिया अब बहुत अधिक इंटेलिजेंट होने वाली है।