गलतियों से सीखकर खुद को अपग्रेड करने वाले AI एजेंट्स की दस्तक

वह पुराना सपना, जिसमें AI खुद अपने कोड लिखकर खुद को अपग्रेड करता था, अब साइंस-फिक्शन की किताबों से निकलकर सीधे आपके GitHub रिपॉजिटरी में पहुंच गया है। हालांकि ‘स्व-विकसित’ (self-evolving) एजेंट्स का विचार काफी समय से चर्चा में था, लेकिन अब कुछ नए ओपन-सोर्स प्रोजेक्ट्स ने इस कॉन्सेप्ट को एक व्यावहारिक—और शायद थोड़ा हैरान कर देने वाली—हकीकत में बदल दिया है। इस रेस में सबसे आगे हैं MetaClaw, जो अपनी नाकामियों से नए हुनर (skills) सीखने वाला एक फ्रेमवर्क है, और AutoResearch, एआई की दुनिया के दिग्गज Andrej Karpathy का एक मिनिमलिस्ट टूल जो LLM डेवलपमेंट को ऑटोपायलट पर डाल देता है।

MetaClaw, जिसे UNC-Chapel Hill की AIMING Lab ने विकसित किया है, इसे इस तरह डिजाइन किया गया है कि यह यूजर्स के साथ होने वाली लाइव बातचीत से सीधे सीख सके। भारी-भरकम ऑफलाइन ट्रेनिंग का इंतजार करने के बजाय, MetaClaw असफल बातचीत (failed interactions) का विश्लेषण करता है और एक LLM का इस्तेमाल करके खुद-ब-खुद नई “स्किल्स” तैयार करता है, ताकि वही गलती दोबारा न हो। सीधे शब्दों में कहें तो, यह सिस्टम एक एजेंट को अपनी ही गलतियों से सीखकर वक्त के साथ विकसित होने की ताकत देता है—एक ऐसी खूबी जिसका इंतजार हम इंसान आज भी अपने सॉफ्टवेयर अपडेट्स में कर रहे हैं। इस पूरे प्रोजेक्ट का विवरण इसके हाइपरलिंक पर उपलब्ध है: MetaClaw GitHub repository

इस आग में घी डालने का काम किया है Andrej Karpathy ने, जो Tesla में AI के पूर्व प्रमुख और OpenAI के संस्थापक सदस्यों में से एक रहे हैं। उन्होंने हाल ही में AutoResearch को ओपन-सोर्स किया है। यह एक बेहद सरल लेकिन शानदार फ्रेमवर्क है जो एक AI एजेंट को स्वायत्त रूप से मशीन लर्निंग प्रयोग (experiments) करने की अनुमति देता है। यह एजेंट ट्रेनिंग कोड में बदलाव करता है, पांच मिनट का एक छोटा प्रयोग चलाता है, नतीजों का आकलन करता है और फिर तय करता है कि उस बदलाव को रखना है या हटा देना है। जैसा कि Karpathy ने चुटकी लेते हुए कहा, AI रिसर्च करने वाले “मीट कंप्यूटर्स” (यानी हम इंसान) का दौर अब शायद ढलान पर है। यह प्रोजेक्ट हाइपरलिंक पर उपलब्ध है: AutoResearch GitHub repository.

यह विचार पूरी तरह नया नहीं है; Máté Benyovszky जैसे कुछ डेवलपर्स ने फरवरी 2026 की शुरुआत में ही “दूसरी पीढ़ी” के स्व-विकसित एजेंट्स पर अपने काम का जिक्र किया था। हालांकि, अब मजबूत ओपन-सोर्स फ्रेमवर्क्स का आना एक बड़े ‘इन्फ्लेक्शन पॉइंट’ का संकेत है।

यह इतना महत्वपूर्ण क्यों है?

आज के दौर में सबसे बड़ी बाधा वे ‘स्टैटिक’ AI मॉडल्स हैं, जो लॉन्च होते ही पुराने (obsolete) हो जाते हैं। स्व-विकसित एजेंट्स एक बुनियादी बदलाव को दर्शाते हैं—एक तैयार प्रोडक्ट को रिलीज करने के बजाय, अब हम एक ऐसा सिस्टम बना रहे हैं जो असल दुनिया में लगातार खुद को ढाल सकता है और सुधार सकता है। रोबोटिक्स के लिए इसके मायने चौंकाने वाले हैं। हर छोटे एक्शन या अपवाद (exception) की कोडिंग करने के बजाय, एक रोबोट किसी काम में फेल होने के बाद खुद ही नई फिजिकल स्किल्स सीख सकेगा। यह एक साधारण मशीन और एक वास्तविक स्वायत्त प्रणाली (autonomous system) के बीच का अंतर है, और ऐसा लगता है कि उस भविष्य को बनाने वाले औजार आखिरकार हमारे हाथ लग गए हैं।