1X의 새 AI, 로봇들이 매트릭스에서 연습할 수 있도록 미래를 예측하다

멀티백만 달러짜리 휴머노이드 로봇에게 당신의 고양이를 먼지 뭉치로 착각하지 않도록 가르치는 방법이 궁금하신가요? 혹은 그 로봇이 캐비닛 문을 뜯어내지 않고 뻑뻑한 피클 병 뚜껑을 여는 법을 어떻게 배울까요? 당신은 로봇이 실제 환경에서 연습하도록 내버려 두면서 우스꽝스럽고 (그리고 비싼) 실수 모음을 평생 만들 수도 있습니다.

아니면, 로봇 회사 1X라면, 그저 자신들의 로봇을 위한 매트릭스를 구축하면 됩니다.

오늘, 1X는 **1X 월드 모델(1XWM)**을 공개했습니다. 이는 원자의 세계와 비트의 세계를 잇는 획기적인 AI입니다. 이는 미래를 예측할 수 있는 초고화질 시뮬레이터로, NEO 휴머노이드 로봇들이 당신의 집에서 발을 내딛기 전에 디지털 놀이터에서 연습하고, 실패하고, 배울 수 있게 해줍니다.

이것은 단순한 비디오 게임 엔진이 아닙니다. 이것은 로봇 공학을 위한 수정 구슬이며, 진정한 자율 안드로이드를 만드는 데 있어 가장 큰 병목 현상 중 하나를 해결할 준비가 되어 있습니다.

문제: 현실 세계 테스트는 고통스럽다

1X의 궁극적인 목표는 가장 혼란스러운 환경, 즉 우리의 가정에 NEO 로봇을 배치하는 것입니다. 그곳은 자동차 열쇠가 신비롭게 순간 이동하고, 가구가 마음대로 재배치되며, 그 특정한 투퍼웨어 뚜껑 하나가 2019년부터 사라진 곳입니다.

로봇의 프로그래밍(또는 “정책”)을 모든 가능한 시나리오에 대해 테스트하는 것은 물리적으로 불가능합니다. 수백만 개의 어수선한 부엌을 재현할 수는 없습니다. 1X의 말처럼, “각 정책을 물리적으로 평가하는 데는 수명이 걸릴 것입니다.”

1XWM: 로봇을 위한 디지털 수정 구슬

1X 월드 모델이 그 해답입니다. 이 모델은 실제 세계의 시작점—방의 몇 프레임 비디오—을 가져와 로봇의 특정 행동에 따라 다음에 무슨 일이 일어날지 예측합니다.

그리고 이것이 일반적인 “텍스트-투-비디오” AI와 결정적으로 다른 점입니다. 1XWM은 **행동 제어(action-controllable)**가 가능하다는 것입니다. 당신은 “카운터를 닦아라"와 같은 모호한 프롬프트를 주는 것이 아닙니다. 로봇의 정확한 저수준 행동 궤적—관절의 정확한 각도, 팔의 속도, 잡는 힘—을 모델에 주입합니다. 그러면 모델은 천이 표면을 닦는 물리적 작용이나 문이 경첩에서 흔들리는 것까지 시뮬레이션하여 결과를 예측합니다.

결과는 놀랍습니다. 이 모델은 동일한 시작점에서 여러 개의 뚜렷한 미래를 생성할 수 있으며, NEO가 머그잔을 잡았을 때와 가상의 기타를 연주했을 때 일어날 일을 보여줍니다. 이를 통해 1X는 실제 세계에서 물체를 한 번도 움직이지 않고도 AI를 스트레스 테스트하며 훨씬 짧은 시간 안에 수백만 번의 실험을 실행할 수 있습니다.

매트릭스 용어 해설: 간단 가이드

방금 빨간 약을 삼킨 기분이 드시나요? 핵심 용어를 분석해 봅시다.

“월드 모델(World Model)“이란 무엇인가요? AI의 내부 상상력이라고 생각하시면 됩니다. 이것은 세상이 어떻게 작동하는지에 대한 시뮬레이션으로, AI가 특정 행동을 취했을 때 “다음에 무슨 일이 일어날지” 예측할 수 있게 해줍니다. 시행착오를 통해 배우는 것과 먼저 결과를 생각해보는 것의 차이입니다.

“로봇 정책(Robot Policy)“이란 무엇인가요? 간단히 말해, 로봇의 두뇌 또는 의사 결정 전략입니다. 로봇이 보고, 듣고, 느끼는 것에 따라 어떤 행동을 취해야 할지 알려주는 복잡한 규칙 세트입니다. 월드 모델은 어떤 “정책"이 가장 좋은지 신속하게 평가하는 데 사용됩니다.

“행동 제어(Action-Controllable)“는 무엇을 의미하나요? 시뮬레이션이 일반적인 텍스트 명령이 아닌, 로봇의 정확하고 정밀한 움직임에 의해 안내된다는 의미입니다. 이는 물리학을 현실적으로 시뮬레이션하는 데 매우 중요합니다. 모델은 로봇이 문을 밀려고 하는지 당기려고 하는지 알아야 합니다.

“고유수용감각(Proprioception)“이란 무엇인가요? 이것은 로봇의 신체에 대한 감각입니다. 로봇은 자신을 “볼” 필요 없이 자신의 사지 위치, 관절 각도, 공간에서의 움직임을 알고 있습니다. 이것은 인간의 촉감과 균형 감각이지만 로봇을 위한 것입니다. 1X는 고유수용감각을 사용하는 정책이 성능이 훨씬 더 우수하다는 것을 발견했습니다.

“반사실(Counterfactuals)“이란 무엇인가요? 이것들은 “만약에(what-if)” 시나리오입니다. 월드 모델은 로봇이 실제 세계에서 실패한 상황을 가져와서 만약 다른 행동을 취했다면 “어떤 일이 일어났을지” 시뮬레이션할 수 있습니다. 로봇 훈련을 위한 타임머신과 같습니다.

가상 연습에서 실제 지능으로

그렇다면 이 모든 디지털 백일몽이 실제로 더 나은 로봇을 만드는 데 도움이 될까요? 1X에 따르면 대답은 “확실히 그렇다"입니다.

월드 모델의 예측과 실제 결과 사이에는 높은 상관관계가 있습니다. 시뮬레이터가 AI의 한 버전이 다른 버전보다 특정 작업에서 더 낫다고 예측했을 때, 실제 평가에서 그것이 옳다는 것이 입증되었습니다. 이 즉각적인 피드백 루프는 혁명적이며, 그들이 다음을 수행할 수 있도록 합니다.

  • 최고의 두뇌 선택: 길고 지루한 물리적 테스트 없이 훈련 실행에서 가장 성능이 좋은 AI 모델을 신속하게 선택합니다.
  • 실수로부터 학습: 실제 세계의 실패 데이터 세트를 큐레이션하고 모델을 사용하여 로봇이 다르게 했어야 할 일을 탐색합니다.
  • 학습 확장: 모델이 더 많은 데이터를 볼수록 더 똑똑해집니다. 심지어 한 작업에서 얻은 지식을 다른 작업으로 이전할 수도 있습니다. 선반을 다루는 능력이 향상되면 아케이드 기계를 이해하는 데도 도움이 됩니다.

물론 완벽하지는 않습니다. 1X는 자신들의 한계를 투명하게 밝히고 있습니다. 이 모델은 현재 이전에 본 적 없는 물체와의 상호 작용을 시뮬레이션하는 데 어려움을 겪고 있습니다. 하지만 훈련 데이터의 양이 증가함에 따라 이 “상상력 격차"는 줄어들 것으로 예상됩니다.

미래는 합성이다

1X의 최종 목표는 엄청납니다. 그들은 충분히 발전된 월드 모델이 실제 데이터와 구별할 수 없는 합성 데이터를 생성할 수 있다고 믿습니다.

그렇게 되면 수십 년 동안 로봇 공학을 괴롭혀 온 데이터 병목 현상이 사라질 수 있습니다. 더 이상 데이터를 수집하는 데 몇 년을 보낼 필요가 없습니다. 모델 내부에서 무한하고 완벽하게 맞춤화된 훈련 시나리오를 생성할 수 있습니다.

1X 팀이 말했듯이, “데이터와 평가는 자율성 문제를 해결하는 초석이며, 1XWM은 두 가지 과제를 모두 해결하기 위한 통합된 경로를 제공합니다.”

이것은 대담한 비전입니다. 안드로이드가 실제 세계뿐만 아니라 그들 자신의 디지털 세계, 즉 우리 세상을 준비시키는 매트릭스에서 훈련되는 미래입니다. 그리고 언제나처럼, RoboHorizon Magazine은 그 시뮬레이션된 미래가 우리의 현실이 되는 과정을 보도할 것입니다.