RoboHorizon AI: अब रोबोट भी करेंगे घंटों चलने वाले जटिल काम

स्वीडिश फर्नीचर डिजाइनरों की धड़कनें अब बढ़ने वाली हैं। शोधकर्ताओं ने RoboHorizon नाम का एक नया AI फ्रेमवर्क पेश किया है, जो रोबोट्स की जटिल और कई चरणों वाले कामों को करने की क्षमता में जबरदस्त इजाफा करता है। यह सिस्टम बड़ी चतुराई से एक Large Language Model (LLM) का इस्तेमाल किसी ‘प्रोजेक्ट मैनेजर’ की तरह करता है, जो अस्पष्ट निर्देशों को छोटे-छोटे और पूरे किए जा सकने वाले उप-कार्यों (sub-tasks) में तोड़ देता है और रोबोट को सही रास्ते पर रखने के लिए एक सटीक रिवॉर्ड स्ट्रक्चर तैयार करता है। इस नए Recognize-Sense-Plan-Act (RSPA) पाइपलाइन की बदौलत ‘लॉन्ग-होराइजन’ (लंबे समय तक चलने वाले) कार्यों की सफलता दर में 29.23% का भारी उछाल देखा गया है।

लॉन्ग-होराइजन रोबोटिक्स में सबसे बड़ी समस्या ‘स्पार्स रिवार्ड्स’ (sparse rewards) की होती है; यानी रोबोट को दर्जनों जटिल चरणों के बाद ही पता चलता है कि वह सफल हुआ या नहीं। ऐसे में यह सीखना मुश्किल हो जाता है कि कौन सा विशिष्ट कदम सही था। RoboHorizon इस समस्या का समाधान एक विस्तृत चेकलिस्ट बनाकर निकालता है, जिसमें हर स्टेप के लिए रिवॉर्ड तय होते हैं। इसके साथ ही, इसमें “की-फ़्रेम डिस्कवरी” (keyframe discovery) तकनीक का इस्तेमाल किया गया है, जो रोबोट के विजुअल सिस्टम को काम के सबसे महत्वपूर्ण क्षणों पर ध्यान केंद्रित करने में मदद करती है—जैसे कि वह सटीक पल जब ग्रिपर किसी वस्तु को पकड़ता है। यह बिल्कुल वैसा ही है जैसे कोई बिना विचलित हुए मैनुअल के निर्देशों को ध्यान से पढ़ रहा हो।

A diagram illustrating the Recognize-Sense-Plan-Act (RSPA) pipeline used by RoboHorizon.

इसका सबसे बेहतरीन उदाहरण FurnitureBench पर देखने को मिला, जो IKEA से प्रेरित असेंबली टास्क की एक सीरीज है और जिसे स्वायत्त प्रणालियों (autonomous systems) के पसीने छुड़ाने के लिए ही बनाया गया है। इस टेस्ट में लॉन्ग-टर्म प्लानिंग, बारीकी से काम करने की कुशलता और अलग-अलग हिस्सों को सही ढंग से जोड़ने की जरूरत होती है—ऐसी चुनौतियां जो मौजूदा मॉडलों को उलझा देती हैं। RoboHorizon की यहां मिली सफलता उस दिशा में एक बड़ा कदम है, जहां रोबोट उन जटिल असेंबली कामों को संभाल सकेंगे जो अब तक सिर्फ इंसानों के बस की बात और उनके लिए सिरदर्द रही हैं।

A table showing RoboHorizon's performance metrics across various benchmark tasks.

यह क्यों महत्वपूर्ण है?

यह शोध वास्तव में उपयोगी और ‘जनरल-पर्पस’ रोबोट बनाने की राह में आने वाली एक बुनियादी बाधा को दूर करता है। LLMs की अमूर्त योजना बनाने की क्षमता को रोबोटिक वर्ल्ड मॉडल के भौतिक क्रियान्वयन के साथ जोड़कर, RoboHorizon उन मशीनों के लिए एक ब्लूप्रिंट पेश करता है जो भरोसेमंद तरीके से जटिल काम पूरे कर सकें। केवल एक ही तरह के दोहराव वाले कामों तक सीमित रहने के बजाय, यह दृष्टिकोण उन रोबोट्स के लिए रास्ता खोलता है जो फैक्ट्रियों, लैब और यहां तक कि हमारे घरों में भी कई चरणों वाले कामों की योजना बना सकेंगे, तालमेल बिठा सकेंगे और उन्हें अंजाम दे सकेंगे। यह एक सक्षम रोबोटिक असिस्टेंट के सपने को हकीकत के एक कदम और करीब ले आया है।