10만 줄의 코드를 지운 피규어 AI, '설거지하는 로봇'의 탄생

그동안 휴머노이드 로봇은 테크 업계의 ‘어설픈 사춘기 소년’ 같은 존재였습니다. 정해진 안무에 맞춰 춤을 추거나 백플립을 하는 데는 능숙했지만, 정작 실생활에서 도움이 되는 집안일을 시키면 엉성하기 짝이 없었죠. 로봇 공학계는 오랫동안 ‘이동-조작(Loco-manipulation)‘이라는 난제에 가로막혀 있었습니다. 로봇이 고가의 부품 더미로 무너지지 않으면서 걷는 동시에 손을 사용하는, 그 지독하게 복잡한 문제를 해결하지 못했던 겁니다.

하지만 **피규어 AI(Figure AI)**가 선보인 새로운 AI 모델 **헬릭스 02(Helix 02)**는 차원이 다릅니다. 이제 로봇은 단순히 ‘걷으면서 껌을 씹는’ 수준을 넘어섰습니다. 헬릭스 02를 탑재한 로봇은 4분 동안 자율적으로 움직이며 깨지기 쉬운 그릇을 나르고 식기세척기를 비웁니다. 이는 단순히 보기 좋게 편집된 짧은 데모 영상이 아닙니다. 픽셀 데이터에서 토크 제어까지, 단 하나의 신경망이 휴머노이드의 전신을 제어하며 이동과 조작 사이의 간극을 마침내 메웠음을 증명하는 순간입니다.

누더기 코드로 기운 ‘프랑켄슈타인 로봇’의 종말

기존에 휴머노이드에게 유용한 작업을 시키려면 마치 ‘프랑켄슈타인의 괴물’처럼 조각조각 기워 붙인 복잡한 코드가 필요했습니다. 보행을 담당하는 컨트롤러가 중심을 잡으면, 다른 컨트롤러가 팔을 뻗고, 또 다른 컨트롤러가 물건을 잡는 식이었습니다. 과정은 느리고 위태로웠으며, 무엇보다 부자연스러웠죠. 만약 물체가 예상치 못한 방향으로 조금만 움직여도, 이 연약한 논리의 탑은 순식간에 무너져 내렸습니다.

피규어 AI 측은 “진정한 자율성을 위해서는 근본적으로 다른 접근이 필요합니다. 전신을 동시에 추론하는 단일 학습 시스템, 즉 끊임없이 인지하고 결정하며 행동하는 시스템이 필요합니다"라고 강조합니다.

헬릭스 02는 바로 이 문제를 해결하기 위해 설계되었습니다. 이질적인 시스템들을 억지로 이어 붙이는 대신, 피규어 AI는 통합된 전체로서 사고하고 행동하는 계층형 AI 아키텍처를 구축했습니다.

로봇의 몸을 움직이는 세 가지 층위의 두뇌

헬릭스 02의 마법은 각기 다른 시간 단위로 작동하는 세 가지 시스템 아키텍처에 숨어 있습니다. 이는 마치 전략을 짜는 CEO부터 실무를 수행하는 인턴까지 이어지는 기업의 의사결정 구조와 닮았습니다.

  • 시스템 2 (전략가): 고차원적 추론 계층입니다. 장면과 언어를 분석하여 “식기세척기를 비워줘"라는 명령을 일련의 목표로 세분화합니다. 느리지만 큰 그림을 그리며 사고하는 역할입니다.
  • 시스템 1 (전술가): 로봇의 모든 감각(헤드 카메라, 새로운 손바닥 카메라, 손가락 끝의 촉각 센서)을 모든 관절에 연결하는 시각-운동 정책(Visuomotor policy)입니다. 시스템 2의 목표를 200Hz의 빠른 속도로 전신 명령으로 변환합니다.
  • 시스템 0 (운동선수): 1,000시간 이상의 인간 움직임 데이터를 학습한 토대(Foundation) 모델입니다. 1kHz라는 압도적인 속도로 작동하며 모든 움직임이 안정적이고 자연스럽게 균형을 유지하도록 합니다. 놀라운 점은, 피규어 AI가 이 시스템 0을 통해 무려 109,504줄에 달하는 수동 프로그래밍 C++ 코드를 단 하나의 신경망으로 대체했다는 사실입니다. 수만 권의 코딩 지침서를 폐기하는 대신, 인간의 움직임을 ‘정주행’하며 스스로 학습한 AI를 채용한 셈입니다.
Video thumbnail

이러한 ‘픽셀-투-전신(Pixels-to-whole-body)’ 파이프라인 덕분에 로봇은 4분간의 식기세척기 작업 중 61개의 서로 다른 이동-조작 동작을 수행할 수 있습니다. 걷기, 운반하기, 배치하기 사이를 매끄럽게 전환하며, 심지어 양손이 가득 찼을 때는 엉덩이로 서랍을 밀어 닫는 기지까지 발휘합니다.

그래서, 실제로 무엇을 할 수 있나?

식기세척기 작업이 이번 발표의 하이라이트이긴 하지만, 피규어 03(Figure 03) 로봇에 도입된 새로운 하드웨어, 특히 손바닥 카메라와 촉각 센서는 정교함의 차원을 한 단계 높였습니다. 이 센서들은 기존의 시각 전용 시스템으로는 불가능했던 작업들에 필요한 피드백을 제공합니다.

새로운 촉각 센서는 단 3g의 힘까지 감지할 수 있는데, 이는 종이 클립 하나의 무게를 느낄 수 있을 만큼 예민한 수준입니다. 덕분에 이전과는 비교할 수 없는 미세 운동 능력이 가능해졌습니다.

식기 정리를 넘어선 정교함

헬릭스 02는 자신의 미세 운동 능력을 증명하기 위해 다음과 같은 고난도 과제들을 수행했습니다:

  • 병뚜껑 돌려 따기: 병을 으깨지 않으면서도 정확한 힘 조절과 양손의 협응이 필요합니다.
  • 약통에서 알약 한 알 집기: 메인 헤드 카메라가 가려지는 사각지대에서도 손바닥 카메라를 이용해 근접 시야를 확보합니다.
  • 주사기에서 정확히 5ml 배출하기: 매끄럽고 연속적인 힘을 가하기 위해 정밀한 촉각 피드백이 요구되는 작업입니다.
  • 뒤섞인 상자에서 금속 부품 골라내기: 피규어 AI의 자체 제조 시설인 BotQ에서 실제로 수행되는 작업으로, 무질서하고 예측 불가능한 환경에서의 적응력을 보여줍니다.

분석: ‘쓸모 있는’ 휴머노이드를 향한 결정적 도약

그동안 많은 기업이 로봇의 화려한 운동 능력을 뽐내왔지만, 피규어 AI는 화려하진 않아도 실생활에서 꼭 필요한 ‘유용성’이라는 난제에 집중하고 있습니다. 상반신만 제어하던 초기 헬릭스에서 단 1년 만에 전신 자율성을 갖춘 헬릭스 02로 진화한 속도는 이 분야의 발전 속도가 얼마나 가파른지 보여주는 지표입니다.

핵심은 경직된 수동 코딩 방식에서 벗어나 스스로 학습하고 적응하는 시스템으로 완전히 전환했다는 점입니다. 방대한 인간 움직임 데이터를 통해 이족 보행 로봇이 어떻게 움직이고 균형을 잡아야 하는지에 대한 ‘본능’을 심어준 것입니다. 덕분에 상위 계층 AI는 ‘어떻게’ 움직일지 고민하는 대신 ‘무엇을’ 할지에만 집중할 수 있게 되었습니다.

이는 단순히 한 가지 일을 완벽하게 하는 로봇을 만드는 것이 아니라, 무엇이든 배울 수 있는 ‘플랫폼’을 구축하는 과정입니다. 피규어 AI의 CEO 브렛 애드콕(Brett Adcock)이 언급했듯, 헬릭스 신경망의 개선 사항은 전체 로봇 군단에 즉시 적용될 수 있습니다. 한 대의 로봇이 배운 것이 모두의 지식이 되는 구조입니다. 현재 로봇의 액추에이터가 최대 속도의 20~25% 수준에서 작동하고 있다는 점을 감안하면, 하드웨어 교체 없이도 성능이 비약적으로 향상될 여지는 충분합니다.

아직 초기 단계이긴 하지만, 이번 발표는 근본적인 패러다임의 전환을 의미합니다. 전신 자율성 문제를 해결함으로써, 피규어 AI는 복잡한 상태 기계(State machine) 없이도 스스로 집안일을 돕는 진정한 ‘범용 로봇’ 시대를 향해 거대한 한 걸음을 내디뎠습니다.