로봇 공학에는 ChatGPT 모먼트가 오지 않을 이유 업계 전문가 분석

벤처 캐피털의 자금이 파도처럼 밀려들고, 유튜브의 데모 영상은 수백만 조회수를 기록하며, 매 분기마다 더 대담한 약속들이 쏟아집니다. OpenAI의 ChatGPT가 하룻밤 사이에 디지털 세상을 정복하는 것을 목격한 후, 모두가 수십억 달러짜리 질문을 던지고 있습니다. “로봇공학의 ‘챗GPT 모먼트(ChatGPT moment)‘는 도대체 언제 오는가?”

피지컬 AI(Embodied AI)의 최전선에서 고군분투해온 두 남자에 따르면, 답은 간단합니다. “그런 순간은 오지 않는다"는 것이죠. 그리고 우리는 그들의 말에 귀를 기울일 필요가 있습니다. 휴머노이드 로봇 ‘디지트(Digit)‘를 만든 Agility Robotics의 공동 창업자 조나단 허스트(Jonathan W. Hurst)와 Google X에서 ‘에브리데이 로봇(Everyday Robots)’ 프로젝트를 이끌었던 한스 피터 브뢴드모(Hans Peter Brøndmo)가 하이프(Hype) 열차에 차가운 산업용 냉각수를 끼얹는 ‘현실 자각 타임’을 선사했습니다. 이들은 단 한 번의 마법 같은 AI 돌파구가 세상을 구원하러 오는 일은 없을 것이라고 단언합니다. 유용한 로봇이 가득한 세상으로 가는 길은 지루하고, 점진적이며, 전혀 섹시하지 않은 엔지니어링의 고된 여정으로 닦여 있다는 것입니다.

2024년 로봇 공학 분야의 벤처 투자액이 2023년 51억 달러에서 61억 달러로 급증하며 판돈은 천문학적으로 커졌습니다. 하지만 허스트와 브뢴드모는 화려한 데모 영상과 상업적으로 생존 가능한, 안전하고 신뢰할 수 있는 로봇 사이에는 여전히 거대한 심연이 존재한다고 주장합니다.

화려한 환상: 유튜브 데모 영상의 민낯

우리는 이미 수없이 보아왔습니다. 휴머노이드 로봇이 완벽하게 백플립을 하고, 군무를 추거나, 정교하게 짜인 무술 동작을 선보이는 영상들을 말이죠. 최근 화제가 된 영상에서는 Unitree Robotics의 휴머노이드들이 2026년 중국 춘제 갈라 쇼에서 어린 출연자들 바로 옆에서 쿵푸 공연을 펼치며 인상적인 협응력을 보여주기도 했습니다.

Video thumbnail

하지만 허스트와 브뢴드모는 업계 내부자들이 수년 전부터 알고 있던 사실을 꼬집습니다. “유튜브 속 로봇 영상은 절대 믿지 마라"는 것입니다. 기술적으로는 놀랍지만, 이러한 퍼포먼스는 로봇 공학이라기보다 세밀하게 기획된 ‘브로드웨이 공연’에 가깝습니다. 이는 놀라운 수준의 저수준 모터 제어와 안무 능력을 보여주지만, 자율성 수준으로 치면 사고하는 기계보다는 조립 라인의 로봇에 훨씬 가깝습니다. 무질서하고, 예측 불가능하며, 고집스러울 정도로 각본이 없는 ‘현실 세계’는 전혀 다른 차원의 문제입니다. 이것이 바로 ‘모라벡의 역설(Moravec’s paradox)‘의 전형적인 사례입니다. 지저분한 방을 돌아다니는 것처럼 인간에게는 사소한 일이 로봇에게는 태산 같은 과제인 반면, 복잡한 계산은 로봇에게 식은 죽 먹기인 상황 말이죠.

데이터 확보, 그 고통스러운 헤라클레스적 과제

LLM(대규모 언어 모델)은 엄청난 이점을 가졌습니다. 텍스트와 이미지로 이루어진 거대한 인간 지식의 보고인 인터넷을 학습 데이터로 활용할 수 있었기 때문입니다. 하지만 로봇에게는 그런 사치가 허용되지 않습니다. 로봇이 배우기 위해서는 물리적 세계의 데이터가 필요합니다. 관절의 각도와 힘 피드백부터 조명 조건, 사람들의 예측 불가능한 움직임에 이르기까지 모든 것이 변수가 되는 고차원적인 공간의 데이터 말이죠.

이 도전의 규모는 압도적입니다. 브뢴드모의 팀이 이끌던 Everyday Robots는 2022년, 로봇이 쓰레기를 분리수거하는 단 하나의 기술을 제대로 익히게 하기 위해 무려 2억 4천만 번의 시뮬레이션을 돌려야 했습니다. 그것도 상대적으로 단순한 작업 하나를 위해서 말입니다. 이제 우리가 범용 로봇에게 기대하는 무한에 가까운 작업들에 이 노력을 곱해 보십시오. 이는 데이터 수집 문제의 차원 자체가 다르며, 여전히 해결되지 않은 난제로 남아 있습니다. 참고로 이 프로젝트는 모기업인 Alphabet의 비용 절감 조치의 일환으로 2023년 초에 결국 종료되었습니다.

단 하나의 ‘로봇 AI’는 존재하지 않을 것

바퀴가 달렸든, 다리가 있든, 날거나 헤엄치든 모든 로봇을 조종할 수 있는 단 하나의 거대한 AI 모델이 나올 것이라는 생각은 순수한 SF적 상상에 불과합니다. 각기 다른 하드웨어 형태(Embodiment)와 환경이 마주하는 물리적 실체가 너무나 방대하기 때문입니다. 저자들은 승리하는 아키텍처는 이른바 ‘에이전틱 AI(Agentic AI)‘가 될 것이라고 주장합니다. 이는 추론하고 계획하며, 여러 특화된 소규모 AI 툴에 작업을 할당하는 ‘상위 조정 모델’의 형태를 띱니다. 어떤 모델은 이족 보행을 담당하고, 다른 모델은 정교한 손동작을, 또 다른 모델은 인간과의 안전한 상호작용을 전담하는 방식입니다.

이러한 모듈식 접근 방식이 유능하고 지능적인 기계들의 ‘캄브리아기 대폭발’을 이끌어낼 것이라는 게 그들의 견해입니다. 단 한 번의 빅뱅이 아니라, 다양하고 특화된 능력들이 꽃을 피우고 이들이 정교하게 조율될 때 비로소 진정으로 유능한 기계가 탄생한다는 것입니다.

하드웨어는 여전히 고통스러운 병목 구간

AI에 모든 관심이 쏠려 있지만, 로봇은 결국 물리적인 물체입니다. 특히 로봇이 세상과 상호작용하게 해주는 하드웨어 부품들은 여전히 큰 병목 현상을 겪고 있습니다. 대부분의 산업용 로봇은 단단하고 강력한 액추에이터(Actuators)를 사용합니다. 격리된 구역 내에서의 정밀도에는 환상적이지만, 인간이 있는 환경에서는 재앙이 될 수 있죠. 살짝만 부딪혀도 치명적인 사고로 이어질 수 있기 때문입니다.

반면 인간은 ‘유연(Compliant)‘합니다. 우리는 열쇠를 구멍에 맞추려 흔들거나 카운터에 몸을 기댈 때 끊임없이 촉각과 힘 피드백을 사용합니다. 로봇이 이 수준에 도달하려면 민감하고, 유연하며, 힘을 인지할 수 있는 새로운 차원의 액추에이터가 필요합니다. 실험실 수준에서는 존재하지만, 대규모 보급을 위한 규모의 경제, 비용, 신뢰성을 충족하는 단계에는 아직 도달하지 못했습니다. 세상에서 가장 똑똑한 AI를 가졌더라도, 그 몸체가 둔탁하고 위험한 짐덩어리라면 아무런 소용이 없습니다.

진정한 가치는 ‘쉬운’ 문제를 해결하는 데서 나온다

마지막으로, 그리고 어쩌면 가장 중요한 진실은 현실 세계의 가치가 ‘백플립’에서 나오지 않는다는 점입니다. 진정한 가치는 인간이 하기 싫어하는 지루하고 반복적이며 육체적으로 고된 일들을 신뢰성 있게 수행하는 데서 나옵니다. 여기서 비로소 로봇의 발이 물류창고 바닥에 닿는, 진짜 승부가 시작됩니다.

두 저자 모두 뼈아픈 경험에서 우러나온 조언을 건넵니다. Agility RoboticsGXO Logistics와 같은 파트너와 함께 ‘디지트’를 현장에 배치하기 시작했을 때, 그들이 마주한 첫 번째 장벽은 작업 수행 능력이 아니라 ‘안전’이었습니다. 이를 해결하기 위해 인간의 공간에서 안전하게 작동하도록 로봇을 재설계하는 데만 수년의 엔지니어링 노력이 투입되었습니다. GoogleEveryday Robots 팀 역시 사무실 카페테리아의 테이블을 닦는 것처럼 겉보기에 단순해 보이는 환경이 로봇에게는 얼마나 엉망진창이고 어려운 곳인지를 뼈저리게 배웠습니다.

Video thumbnail

이러한 실전 경험만이 앞으로 나아갈 수 있는 유일한 길입니다. 현장의 경험은 AI 아키텍처를 다듬고, 하드웨어의 결함을 드러내며, 야심 찬 로드맵을 고객의 냉혹한 요구라는 현실 위에 뿌리내리게 합니다. 로봇 공학의 미래를 열어줄 마법 같은 알고리즘이나 데이터셋은 존재하지 않습니다. 로봇을 배치하고, 실패를 목격하고, 다시 꼼꼼하게 해결책을 설계하는 느리고 고통스러우며 값비싼 과정만이 답입니다. 로봇의 시대는 오고 있습니다. 다만, 아주 신중하고 정교하게 설계된 ‘한 걸음’씩 우리 곁으로 다가올 뿐입니다.