Humanoid KinetIQ बनाम Figure Helix 02: रोबोटिक वर्चस्व की जंग

ह्युमनॉइड रोबोट्स के लिए एक ‘परफेक्ट’ डिजिटल दिमाग बनाने की इस जबरदस्त होड़ में, एक बहुत ही दिलचस्प वैचारिक जंग छिड़ गई है। अब बात सिर्फ रोबोट के चलने-फिरने या आपको सोड़ा लाकर देने तक सीमित नहीं रह गई है। असली लड़ाई तो उस ‘दिमाग’ के आर्किटेक्चर में है जो इन्हें चलाता है। एक तरफ हमारे पास वो उस्ताद है जो सिर्फ देखकर सब सीख लेता है (end-to-end learning), और दूसरी तरफ है एक बेहद सलीके से व्यवस्थित किया गया सिस्टम। Humanoid अपने नए AI फ्रेमवर्क KinetIQ के साथ इसी दूसरे खेमे में मजबूती से खड़ा है—एक ऐसा सिस्टम जो सिर्फ एक रोबोट को कंट्रोल करने के लिए नहीं, बल्कि रोबोट्स की पूरी फौज का संचालन (orchestration) करने के लिए बनाया गया है।

यह सीधे तौर पर Figure AI के साथ एक बड़े मुकाबले की जमीन तैयार करता है, जिसके Figure का Helix 02: कोडिंग छोड़ अब खुद बर्तन धोएगा रोबोट ने अपनी सहज और लंबी स्वायत्तता (autonomy) से दुनिया को दंग कर दिया है। जहाँ Figure का पूरा जोर एक सिंगल, एकीकृत (unified) न्यूरल नेटवर्क बनाने पर है जो जटिल और कई चरणों वाले काम सीख सके, वहीं Humanoid ‘फ्लीट मैनेजमेंट’ यानी रोबोट्स के पूरे बेड़े को संभालने जैसी पेचीदा इंडस्ट्रियल चुनौती से निपट रहा है। यह एक मंझे हुए कलाकार और एक बड़े जनरल कॉन्ट्रैक्टर के बीच की जंग है, और इसका नतीजा यह तय करेगा कि आने वाले दशकों में रोबोट हमारे समाज और उद्योगों में कैसे घुलते-मिलते हैं।

KinetIQ: संज्ञान की कॉर्पोरेट सीढ़ी

Humanoid का KinetIQ उस पर आधारित है जिसे वे “क्रॉस-टाइमस्केल” आर्किटेक्चर कहते हैं। आसान भाषा में कहें तो यह कमांड और कंट्रोल की चार परतों वाला एक ‘केक’ है। यह एक ऐसा एजेंटिक ढांचा है जो किसी बड़ी कॉर्पोरेशन की तरह सोचता है, जहाँ हर परत अपनी गति और अपनी जिम्मेदारी के हिसाब से काम करती है।

सबसे ऊपर बैठता है System 3, यानी ‘एजेंटिक फ्लीट ऑर्केस्ट्रेटर’। यह कंपनी के ‘सी-सुइट’ (C-suite) की तरह है, जो फैक्ट्री या वेयरहाउस मैनेजमेंट सॉफ्टवेयर के साथ जुड़कर बड़े लक्ष्यों को समझता है। यह सेकंड से लेकर मिनटों के टाइमस्केल पर काम करता है और अपने बेड़े के हर रोबोट को—चाहे वो दो पैरों वाला हो या पहियों वाला—एक संसाधन की तरह इस्तेमाल करता है ताकि काम सबसे कुशलता से हो सके।

एक पायदान नीचे है System 2, जो रोबोट के स्तर का ‘प्रोजेक्ट मैनेजर’ है। यह परत ‘ओम्नी-मोडल’ लैंग्वेज मॉडल का इस्तेमाल करके System 3 के निर्देशों को समझती है और उन्हें एक अकेले रोबोट के लिए छोटे-छोटे टास्क में तोड़ देती है। यह अपने आस-पास के माहौल को समझकर अपनी योजना में तुरंत बदलाव भी कर सकती है—यानी मौके पर ही समस्या सुलझाने में माहिर।

पल-पल के निर्देश देने का काम System 1 का है, जो एक ‘विज़न-लैंग्वेज-एक्शन’ (VLA) नेटवर्क है और एक ‘टीम लीड’ की तरह काम करता है। 5-10Hz की रफ्तार से चलते हुए, यह रोबोट के शरीर के अंगों—हाथ, धड़, कूल्हे—के लिए लगातार ‘टारगेट पोज़’ जारी करता है ताकि System 2 की योजना को अमली जामा पहनाया जा सके।

और आखिर में, सारा भारी काम करने की जिम्मेदारी System 0 की है। यह ‘होल-बॉडी कंट्रोलर’ है, जो 50Hz पर चलता है और जिसे सिमुलेशन में लगभग 15,000 घंटों की ‘रिनफोर्समेंट लर्निंग’ (RL) के जरिए ट्रेन किया गया है। इसका एकमात्र और सबसे जरूरी काम ऊपर से मिलने वाले ‘पोज़ टारगेट्स’ को स्थिर और संतुलित मूवमेंट में बदलना है, ताकि रोबोट डिब्बा उठाते समय मुंह के बल न गिर पड़े।

Video thumbnail

Helix 02: एंड-टू-एंड का उस्ताद

दूसरे कोने में खड़ा है Figure AI का Helix 02, जिसका फलसफा पूरी तरह अलग है। परतों वाली नौकरशाही के बजाय, Helix 02 एक सिंगल, एकीकृत ‘विजुओमोटर न्यूरल नेटवर्क’ के इर्द-गिर्द बना है। इसका मंत्र है “सारे सेंसर अंदर, सारे एक्चुएटर बाहर”—यानी देखना, छूना और शरीर की स्थिति को महसूस करना, ये सब एक ही निरंतर सिस्टम में सीधे हर जोड़ (joint) से जुड़े होते हैं।

हालाँकि यह भी पदानुक्रमित (hierarchical) है, लेकिन इसकी संरचना काफी सघन है:

  • System 2 हाई-लेवल के तार्किक फैसलों को संभालता है, ठीक वैसे ही जैसे KinetIQ की ऊपरी परतें।
  • System 1 ही असली जादूगर है। यह एक शक्तिशाली पॉलिसी है जो सेंसर से मिलने वाली जानकारी को सीधे पूरे शरीर के मूवमेंट में बदल देती है, और वह भी 200Hz की तेज रफ्तार पर।
  • System 0 इसकी शारीरिक बुनियाद है, एक ऐसा कंट्रोलर जो मूवमेंट को सुचारू और स्थिर रखता है। लेकिन KinetIQ के शुद्ध RL दृष्टिकोण के विपरीत, Helix के System 0 को 1,000 से अधिक घंटों के मानव गति डेटा (human motion data) पर ट्रेन किया गया है। इसने इंसानों की तरह संतुलन और तालमेल की बारीकियां सीखी हैं, जिसे बाद में RL के साथ और निखारा गया। यह 1 kHz की जबरदस्त रफ्तार पर काम करता है।

इसी दृष्टिकोण की बदौलत Figure ने अपने रोबोट को चार मिनट तक लगातार डिशवॉशर खाली करते और भरते हुए दिखाया—स्वायत्तता का एक ऐसा कारनामा जो इस क्षेत्र में आज भी एक बेंचमार्क है।

दो दिमागों की कहानी: एक वैचारिक विभाजन

KinetIQ और Helix 02 के बीच का अंतर सिर्फ तकनीकी नहीं है—ये रोबोटिक्स के भविष्य के लिए दो अलग-अलग दृष्टिकोणों का प्रतिनिधित्व करते हैं।

खूबीHumanoid KinetIQFigure AI Helix 02
मुख्य लक्ष्यअलग-अलग तरह के रोबोट्स के बेड़े का संचालन।एक अकेले रोबोट में लंबे समय तक चलने वाली स्वायत्तता।
आर्किटेक्चर4-परतों वाला एजेंटिक फ्रेमवर्क।3-परतों वाला एकीकृत विजुओमोटर नेटवर्क।
System 0 ट्रेनिंग~15,000 घंटे की शुद्ध रिनफोर्समेंट लर्निंग।1,000+ घंटे का इंसानी डेटा + RL।
System 0 स्पीड50 Hz1000 Hz (1 kHz)
मुख्य ताकतस्केलेबिलिटी, विश्वसनीयता और विविध प्लेटफॉर्म का प्रबंधन।तरलता, चपलता और नए, जटिल काम सीखने की क्षमता।
मिसालएक बेहतरीन लॉजिस्टिक्स कंपनी की तरह।एक कड़ी ट्रेनिंग पाए हुए अकेले एथलीट की तरह।

KinetIQ का एजेंटिक और परतों वाला डिजाइन बहुत व्यावहारिक है। जिम्मेदारियों को अलग-अलग बांटकर, Humanoid सैद्धांतिक रूप से पूरे सिस्टम को दोबारा बनाए बिना किसी एक परत को बेहतर बना सकता है या उसे बदल सकता है। यह ‘मॉड्यूलरिटी’ उन औद्योगिक सेटिंग्स के लिए आदर्श है जहाँ विश्वसनीयता और कई मशीनों के बीच तालमेल सबसे महत्वपूर्ण होता है।

Figure का ‘एंड-टू-एंड’ दृष्टिकोण ‘जनरल इंटेलिजेंस’ की तलाश में कहीं अधिक महत्वाकांक्षी है। सिस्टम को इंसानी डेटा पर ट्रेन करके, इसका लक्ष्य शारीरिक क्रियाओं के लिए एक ऐसा ‘फाउंडेशन मॉडल’ बनाना है जो स्वभाव से ही अधिक सुंदर (graceful) हो और वास्तविक दुनिया की उथल-पुथल के बीच खुद को ढाल सके। यह सिर्फ लक्ष्य हासिल करना नहीं, बल्कि इंसानों की तरह चलना-फिरना सीखता है।

असली रेस: चमकदार डेमो से लेकर जमीनी काम तक

अंततः, कौन सा आर्किटेक्चर बेहतर है, इसका फैसला लैब में नहीं, बल्कि फैक्ट्री फ्लोर और हमारे घरों में होगा। Humanoid इस बात पर दांव लगा रहा है कि असली अरबों डॉलर का मौका लॉजिस्टिक्स और मैन्युफैक्चरिंग में है, जहाँ विशेष रोबोट्स के बेड़े का संचालन करना ही सबसे बड़ी चुनौती है। KinetIQ को उसी दुनिया के लिए बनाया गया है।

Figure AI, जटिल और इंसानों जैसे कामों पर ध्यान केंद्रित करके, शायद एक लंबी पारी खेल रहा है। उसका लक्ष्य एक ऐसा सच्चा ‘जनरल-पर्पस’ रोबोट बनाना है जो किसी भी इंसानी माहौल में काम कर सके। दवाइयों को संभालने से लेकर सिरिंज में सटीक मात्रा भरने तक जो चपलता उन्होंने दिखाई है, वह बारीक मोटर कंट्रोल की सीमाओं को लांघने वाले सिस्टम का प्रमाण है।

दौड़ शुरू हो चुकी है। क्या रोबोटिक्स का भविष्य एक बारीकी से काम करने वाले ‘AI फ्लीट मैनेजर’ के हाथ में होगा या एक ‘विलक्षण रोबोटिक उस्ताद’ के? KinetIQ पहले वाले विकल्प के पक्ष में एक मजबूत दलील है—एक ऐसा सिस्टम जिसे हेडलाइंस बटोरने के लिए नहीं, बल्कि 24/7 औद्योगिक तैनाती की कठोर हकीकत के लिए डिजाइन किया गया है। अधिक जानकारी के लिए, आप thehumanoid.ai पर मूल घोषणा पढ़ सकते हैं।