क्या रोबोट अब घर के काम संभालेंगे? BEHAVIOR चैलेंज ने दी चुनौती

दशकों से, घर में काम करने वाले रोबोट का वादा सिर्फ एक वादा ही बनकर रह गया है। हमें अब तक ‘रोजी द रोबोट’ (Rosie the Robot) मिल जानी चाहिए थी, लेकिन इसके बजाय हमें डिस्क के आकार वाले वे वैक्यूम क्लीनर मिले जो अक्सर पायदानों में फंस जाते हैं। साइंस फिक्शन और हमारी घरेलू हकीकत के बीच एक लंबी खाई है, जो असफल स्टार्टअप्स और बढ़ा-चढ़ाकर दिखाए गए डेमो के मलबे से भरी पड़ी है। लेकिन एक नई प्रतियोगिता, BEHAVIOR Challenge, जो NeurIPS 2025 में अपनी शुरुआत करने जा रही है, इस क्षेत्र को जबरन असल दुनिया की दहलीज पर लाने के लिए तैयार है। या कम से कम, असल दुनिया के एक बहुत ही सटीक सिम्युलेशन (Simulation) तक।

इस चैलेंज का लक्ष्य जितना सीधा है, इसे पूरा करना उतना ही कठिन: एक रोबोट से असल में घर के काम करवाना। सिर्फ एक ब्लॉक उठाना काफी नहीं है, बल्कि उन जटिल और बहु-चरणीय गतिविधियों को पूरा करना है जिन्हें हम इंसान बहुत ही साधारण और उबाऊ समझते हैं। BEHAVIOR (Benchmark for Everyday Household Activities in Virtual, Interactive, and Realistic environments) केवल एक और रोबोटिक्स बेंचमार्क नहीं है; यह एक तरह की घरेलू ‘अग्निपरीक्षा’ है जिसे आज के सबसे एडवांस AI को परखने (और शायद उसे पस्त करने) के लिए डिज़ाइन किया गया है। और सच कहें तो, अब इसकी ज़रूरत भी थी।

अनकैनी वैली वाला एक अनोखा घर

BEHAVIOR Challenge के केंद्र में एक बेहद परिष्कृत (Sophisticated) सिम्युलेशन एनवायरनमेंट है, जिसके सामने ज़्यादातर रोबोटिक्स सैंडबॉक्स बच्चों के खेल जैसे लगते हैं। यह कोई साफ-सुथरी लैब नहीं है; यह भौतिकी (Physics) पर आधारित एक हाई-फिडेलिटी दुनिया है जहाँ चीज़ें बिखरी हुई और गंदी भी हो सकती हैं। यह बेंचमार्क तीन स्तंभों पर टिका है:

  • 1,000 रोज़मर्रा के काम: क्यूब्स को एक के ऊपर एक रखने की बात भूल जाइए। यहाँ “गिफ्ट बास्केट सजाना”, “प्लेटों और खाने की सफाई करना” और “हैलोवीन की सजावट समेटना” जैसे काम दिए गए हैं। हर टास्क को BEHAVIOR Domain Definition Language (BDDL) में औपचारिक रूप से परिभाषित किया गया है, जो काम की शुरुआत और उसकी सफलता की सटीक शर्तों को तय करता है।
  • 50 इंटरएक्टिव एनवायरनमेंट: ये सिर्फ स्थिर कमरे नहीं हैं, बल्कि पूरी तरह से इंटरएक्टिव, घर के आकार के लेआउट हैं जिनमें लगभग 10,000 ऐसी चीज़ें हैं जिन्हें छुआ या हिलाया जा सकता है। फ्रिज खोला जा सकता है, टमाटर काटा जा सकता है, और कपड़े को मोड़ा या सिकोड़ा जा सकता है।
  • OmniGibson सिम्युलेटर: NVIDIA के Omniverse प्लेटफॉर्म पर बना यह सिम्युलेटर वह जगह है जहाँ सारा जादू (और फिजिक्स) होता है। OmniGibson न केवल रिजिड-बॉडी फिजिक्स को सपोर्ट करता है, बल्कि इसमें लचीली वस्तुओं (Deformable objects), तरल पदार्थों के साथ तालमेल और गर्म करने, ठंडा करने या काटने जैसे जटिल बदलावों को भी महसूस किया जा सकता है। यही चीज़ इसे अपने पुराने वर्जन से अलग बनाती है और रोबोट्स को उस हकीकत के लिए तैयार करती है जिसका सामना वे एक दिन असली किचन में करेंगे।

यह केवल वस्तुओं को पकड़ने या इधर-उधर जाने का टेस्ट नहीं है। BEHAVIOR अपनी तरह का पहला ऐसा बेंचमार्क है जो रोबोट से हाई-लेवल रीजनिंग, लंबी दूरी की नेविगेशन और दोनों हाथों का कुशलता से उपयोग (Bimanual manipulation) एक साथ करने की मांग करता है। सफल होने के लिए, एक AI को केवल एक चीज़ में माहिर होने से काम नहीं चलेगा; उसे एक (बेहद धैर्यवान) इंसान की तरह सोचना होगा।

Video thumbnail

NeurIPS 2025 की चुनौती

NeurIPS 2025 में अपने पहले रन के लिए, यह चैलेंज वैश्विक रिसर्च कम्युनिटी के सामने ऐसे 50 टास्क पेश कर रहा है। प्रतिभागियों को एक वर्चुअल रोबोट को प्रोग्राम करना होगा ताकि वह उन परिस्थितियों का सामना कर सके जिन्हें पूरा करने में कई मिनट लग सकते हैं, जो कई कमरों में फैले हों और जिनमें दर्जनों छोटे लक्ष्य शामिल हों। “पिज़्ज़ा बनाना” या “कुत्ते के खिलौने धोना” जैसे कामों के बारे में सोचें—ऐसे काम जिनमें प्लानिंग, मेमोरी और ढेर सारी डिजिटल मेहनत की ज़रूरत होती है।

इस सिम्युलेशन टेस्ट के लिए डिफ़ॉल्ट रोबोट Galaxea का R1 Pro है। यह पहियों वाला एक ह्यूमनाइड है जिसमें दो 7-DOF हाथ, एक 4-DOF धड़ और सेंसरों का पूरा सेट लगा है। यह कोई पुराना डिब्बा नहीं है; इसका डिज़ाइन विशेष रूप से उन घरेलू गतिविधियों के लिए चुना गया है जहाँ पहुँच, स्थिरता और दोनों हाथों के बीच तालमेल की सबसे ज़्यादा ज़रूरत होती है।

प्रतिभागियों को शून्य से शुरुआत न करनी पड़े, इसके लिए आयोजक एक विशाल डेटासेट प्रदान कर रहे हैं: 10,000 एक्सपर्ट डेमो, जिसमें कुल 1,200 घंटों का सावधानीपूर्वक रिकॉर्ड किया गया डेटा शामिल है। यह कोई शौकिया फुटेज नहीं है। यह Simovation द्वारा JoyLo टेलीऑपरेशन सिस्टम का उपयोग करके एकत्र किया गया क्लीन और सटीक डेटा है। JoyLo एक चतुर सेटअप है जो हैंडहेल्ड कंट्रोलर्स का उपयोग करता है, जिससे इंसान रोबोट को आसानी से गाइड कर सकते हैं। यह ‘इमिटेशन लर्निंग’ के लिए एक आदर्श टेम्पलेट प्रदान करता है।

यह इतना मुश्किल क्यों है?

AI की दुनिया में “लॉन्ग-होराइजन” (Long-horizon) शब्द का काफी इस्तेमाल होता है, लेकिन BEHAVIOR इसे असलियत में परखता है। “किताबों को स्टोरेज के लिए बॉक्स में पैक करना” जैसे काम के लिए रोबोट को लिविंग रूम में जाना होगा, सही किताबों की पहचान करनी होगी, गैरेज में बॉक्स ढूंढना होगा, उसे वापस लाना होगा और फिर एक-एक करके हर किताब को अंदर रखना होगा। यह लंबी अवधि में प्लानिंग और मेमोरी का ऐसा टेस्ट है जैसा पहले शायद ही किसी बेंचमार्क ने लिया हो।

इसके अलावा, वस्तुओं के साथ होने वाली बातचीत की विविधता भी हैरान कर देने वाली है। रोबोट्स को केवल चीज़ें पकड़ने से कहीं ज़्यादा कौशल दिखाने होंगे। उन्हें तरल पदार्थ डालना होगा, सतहों को पोंछना होगा, सब्जियां काटनी होंगी और स्विच ऑन-ऑफ करने होंगे। चीज़ों को खोला, बंद किया, गर्म, ठंडा, साफ या जलाया भी जा सकता है। कम से कम 30 अलग-अलग बुनियादी कौशलों का यह सेट रिसर्चर्स को सिंगल-टास्क मॉडल से आगे बढ़कर अधिक सामान्य और अनुकूलनीय इंटेलिजेंस (Generalized intelligence) की ओर बढ़ने के लिए मजबूर करता है।

चैलेंज को आसान बनाने के लिए, आयोजक ACT और Diffusion Policy जैसे मानक मॉडलों के साथ-साथ OpenVLA जैसे प्री-ट्रेंड मॉडल भी उपलब्ध करा रहे हैं। पूरा फ्रेमवर्क ओपन-सोर्स है, जिसमें स्टार्टर किट और ट्यूटोरियल भी शामिल हैं ताकि ज़्यादा से ज़्यादा लोग इसमें हिस्सा ले सकें।

एक रोबोटिक बटलर को कैसे परखें?

BEHAVIOR Challenge में सफलता को मुख्य रूप से टास्क सक्सेस रेट (Task success rate) से मापा जाता है। सिस्टम BDDL परिभाषाओं का उपयोग करके यह चेक करता है कि क्या रोबोट ने लक्ष्य की सभी शर्तों को पूरा किया है। आंशिक क्रेडिट (Partial credit) भी दिया जाता है, जो उन समाधानों को प्रोत्साहित करता है जो पूर्णता तक न पहुँचने के बावजूद सार्थक प्रगति करते हैं।

चतुर और अनाड़ी रोबोट के बीच फर्क करने के लिए कुछ अन्य मानक भी देखे जाएंगे:

  • दक्षता (Efficiency): लिया गया समय, तय की गई दूरी और जोड़ों (Joints) की कुल हलचल को मापा जाएगा। एक बेहतरीन समाधान वही है जो तेज़ और सटीक हो।
  • डेटा का उपयोग: आयोजक यह भी नोट करेंगे कि प्रत्येक सबमिशन को ट्रेन करने के लिए 1,200 घंटे के डेमो डेटा में से कितने का उपयोग किया गया था।

प्रतियोगिता आधिकारिक तौर पर 2 सितंबर, 2025 को शुरू हुई, और अंतिम सबमिशन 16 नवंबर तक जमा किए जाने हैं। विजेताओं की घोषणा दिसंबर में सैन डिएगो में NeurIPS कॉन्फ्रेंस में की जाएगी। उन्हें नकद पुरस्कार मिलेगा—पहले स्थान के लिए मामूली 1,000 डॉलर—लेकिन असली इनाम तो साख और एम्बॉडीड AI (Embodied AI) के क्षेत्र को सार्थक रूप से आगे बढ़ाने का मौका है।

अंततः, BEHAVIOR Challenge केवल एक प्रतियोगिता नहीं है; यह पूरे रोबोटिक्स उद्योग के लिए एक ‘रियलिटी चेक’ है। यह एक सावधानीपूर्वक तैयार की गई कसौटी है, जो यह टेस्ट करेगी कि क्या हमारे एल्गोरिदम लैब से बाहर निकलकर इंसान के घर के उस अराजक, अनिश्चित और अक्सर चिपचिपे माहौल में काम करने के लिए तैयार हैं। NeurIPS 2025 के नतीजे हमें केवल यह नहीं बताएंगे कि किसके पास सबसे अच्छा मॉडल है; वे हमें यह दिखाएंगे कि हमारे रोबोट मददगारों के बर्तन धोने के लिए तैयार होने में अभी कितनी लंबी राह बाकी है।