스스로 진화하는 AI 에이전트의 등장, 실패를 통해 배우다

AI가 스스로의 성능을 개선하기 위해 직접 코드를 짜는 모습, 그동안 SF 영화 속 단골 소재로만 머물렀던 이 상상이 이제 우리 곁의 깃허브(GitHub) 저장소에 실재하는 현실로 내려앉았습니다. 스스로 진화하는 에이전트라는 개념은 꽤 오래전부터 회자되어 왔지만, 최근 등장한 일련의 오픈소스 프로젝트들은 이 막연한 아이디어를 조금은 섬뜩할 정도로 정교하고 실용적인 도구로 탈바꿈시키고 있습니다. 그 선봉에는 실패를 통해 새로운 기술을 습득하는 프레임워크 MetaClaw, 그리고 AI 거물 Andrej Karpathy가 내놓은 미니멀리즘 기반의 LLM 자동 개발 도구 AutoResearch가 서 있습니다.

UNC 채플힐(UNC-Chapel Hill)의 AIMING Lab에서 개발한 MetaClaw는 사용자와의 실시간 대화로부터 직접 학습하도록 설계되었습니다. 방대한 양의 오프라인 재학습 과정을 거치는 대신, MetaClaw는 실패한 상호작용을 분석하고 LLM을 활용해 새로운 ‘기술(skill)‘을 자동으로 생성합니다. 똑같은 실수를 두 번 반복하지 않도록 스스로를 업데이트하는 것이죠. 소프트웨어 업데이트가 필요한 건 어쩌면 기계가 아니라 인간일지도 모른다는 생각을 들게 할 만큼, 이 시스템은 자신의 실수를 자양분 삼아 진화합니다. 프로젝트의 상세 내용은 다음 링크에서 확인할 수 있습니다: MetaClaw GitHub repository.

여기에 테슬라의 전 AI 책임자이자 OpenAI의 창립 멤버인 Andrej Karpathy가 가세하며 불을 지폈습니다. 그는 최근 AI 에이전트가 자율적으로 머신러닝 실험을 수행할 수 있게 해주는 간결하면서도 강력한 프레임워크인 AutoResearch를 오픈소스로 공개했습니다. 이 에이전트는 스스로 학습 코드를 수정하고, 5분 내외의 짧은 실험을 실행한 뒤, 결과를 평가하여 해당 변경 사항을 유지할지 폐기할지 결정합니다. 그리고 곧바로 다음 사이클로 넘어가죠. Karpathy는 “이제 ‘고기 컴퓨터(인간)‘가 AI 연구를 수행하는 시대는 저물고 있을지도 모른다"는 특유의 냉소 섞인 농담을 던지기도 했습니다. 이 프로젝트는 다음 링크에서 만나볼 수 있습니다: AutoResearch GitHub repository.

사실 이러한 시도가 완전히 새로운 것은 아닙니다. Máté Benyovszky와 같은 개발자들은 이미 2026년 2월부터 ‘2세대’ 자율 진화 에이전트에 대한 연구 성과를 공유해 왔습니다. 하지만 이제 견고한 오픈소스 프레임워크들이 속속 등장하고 있다는 점은 기술적 임계점에 도달했음을 시사합니다.

이것이 왜 중요한가?

배포되는 순간부터 구식이 되어버리는 정적인 AI 모델은 그동안 기술 발전의 거대한 병목 현상이었습니다. 스스로 진화하는 에이전트의 등장은 ‘완성된 제품’을 출시하던 시대에서, 현실 세계에 적응하며 끊임없이 성장하는 ‘살아있는 시스템’을 방출하는 시대로의 근본적인 패러다임 전환을 의미합니다. 특히 로봇 공학 분야에 미칠 파급력은 상상을 초월합니다. 모든 동작과 예외 상황을 일일이 프로그래밍하는 대신, 로봇이 작업을 실패할 때마다 스스로 새로운 물리적 기술을 터득하게 될 것이기 때문입니다. 이것이 바로 단순한 가전제품과 진정한 자율 시스템을 가르는 결정적 차이이며, 우리는 마침내 그 미래를 구축할 도구를 손에 넣게 되었습니다.