제네시스 AI의 새로운 로봇 두뇌, 하나의 모델로 요리와 피아노 연주 가능

우리 집 로봇청소기가 좀 똑똑해졌다고 감탄하던 시대는 이제 끝났다. 스타트업 Genesis AI가 공개한 새로운 시스템 앞에서는 그저 ‘장난감’ 수준으로 보일 정도니까. 이 회사는 최근 이른바 ‘로봇의 뇌’라고 불리는 GENE-26.5의 구동 영상을 여러 편 공개했는데, 그 면면이 가히 압도적이다. 요리부터 피아노 연주, 정밀한 실험실 작업까지, 이 모든 복잡한 과업을 별도의 재학습 없이 단 하나의 AI 모델만으로 수행해낸다.

CEO인 Zhou Xian이 공유한 영상에 따르면, 모든 시연은 편집 없는 1배속 실시간 자율 주행으로 이루어졌다. 특히 로봇이 정교하게 요리를 준비하는 장면에 대해 Xian은 “우리가 1년 동안 공들여 ‘요리’해온 결과물"이라고 언급했다. 중의적인 표현이 섞인 위트 있는 코멘트지만, 이 문제가 얼마나 난제였는지를 보여주는 대목이기도 하다. 영상 속 로봇은 루빅스 큐브를 맞추는 것은 물론, 밀리미터 단위의 정밀함이 요구되는 실험 기구까지 능숙하게 다루며 놀라운 기교를 뽐낸다.

Genesis AI는 이러한 돌파구의 핵심이 로봇 공학 스택을 바닥부터 완전히 재설계한 데 있다고 주장한다. 이 시스템은 네 가지 핵심 요소로 구성된다. 언어, 시각, 고유 수용성 감각(proprioception), 그리고 촉각 데이터를 통합 학습한 ‘로봇 네이티브’ 파운데이션 모델, 인간의 손과 1:1로 대응하는 로봇 핸드, 인간의 움직임과 힘, 촉각을 그대로 캡처하는 비침습적 데이터 수집 글러브, 그리고 실험 시간을 획기적으로 단축하는 전용 시뮬레이터가 그것이다.

이것이 왜 중요한가?

현대 로봇 공학의 ‘성배’는 바로 범용성(generalization)이다. 각 작업마다 일일이 프로그래밍하지 않아도, 단 하나의 시스템이 다양한 기술을 스스로 배우고 수행하는 능력을 말한다. 그동안 이 분야의 가장 큰 병목 현상은 인간으로부터 고품질의 멀티모달 데이터를 수집하는 일이었다.

Genesis AI의 ‘풀스택’ 접근 방식, 특히 데이터 수집용 글러브와 인간형 로봇 핸드의 조합은 이 문제에 대한 정면 돌파다. 다른 기업들이 거대 AI 모델 자체에만 집중할 때, Genesis AI는 그 모델에 ‘양질의 먹이’를 제공할 생태계 전체를 구축하고 있는 셈이다. 만약 GENE-26.5가 단일 가중치(single set of weights)만으로 이토록 정교하고 다양한 작업을 완벽히 일반화해낼 수 있다면, 우리는 로봇이 단순히 명령을 수행하는 기계를 넘어 진정으로 ‘기술을 습득하는’ 시대로 진입하게 될 것이다.