FunctionGemma: 저렴한 로봇을 구동할 수 있는 작은 AI

2025년 12월 18일, 구글은 조용히 FunctionGemma를 출시했다. 이것은 2억 7천만 파라미터의 작은 AI 모델로, 완전히 기기에서 실행되도록 설계되었다. 보도자료는 스마트폰에 초점을 맞췄다 — 알림 설정, 손전등 켜기/끄기, 일반적인 디지털 어시스턴트 기능들. 하지만 그 스펙 안에는 훨씬 더 흥미로운 것이 숨어 있었다: 로봇을 극적으로 저렴하게 만드는 청사진이다.

오늘날 “스마트” 로봇의 더러운 비밀을 알려주겠다: 대부분은 전혀 스마트하지 않다. 그저 터미널일 뿐이다. 지능은 수천 킬로미터 떨어진 어딘가의 데이터센터에 살고 있으며, 지연을 추가하고, 돈이 들고, 음영 지역에 들어가는 순간 작동하지 않는 인터넷 연결로 연결되어 있다. 창고 로봇이 결정을 내려야 할 때마다, 허락을 구하는 긴장한 10대처럼 집에 전화를 건다.

FunctionGemma는 이 계산을 완전히 바꾼다.

중요한 숫자들

마케팅 허풍은 건너뛰고 로보틱스에 실제로 중요한 것을 살펴보자:

  • 288 MB 저장 공간 – 가장 저렴한 마이크로컨트롤러에도 들어감
  • 550 MB RAM – 라즈베리 파이 4에는 8 GB의 여유가 있음
  • 0.3초 응답 시간 – 기기에서, 네트워크 왕복 없이
  • 기준 정확도 58% → 파인튜닝 후 85% – 특정 작업에 대해 훈련 가능

마지막 포인트가 중요하다. FunctionGemma는 범용 챗봇으로 만들어진 것이 아니다. 좁고 특정한 작업에 파인튜닝되도록 설계되었다 — 정확히 로봇이 하는 일이다. 창고 로봇은 철학에 대해 토론할 필요가 없다. “박스 A를 집어서 선반 B로 옮겨"를 이해하고, 하루에 수천 번 완벽하게 실행해야 한다.

클라우드 의존 로봇이 막다른 길인 이유

“지능형” 로봇의 현재 패러다임은 근본적으로 망가져 있다. 로봇이 결정을 내려야 할 때 무슨 일이 일어나는지 생각해 보자:

  1. 센서 데이터 캡처
  2. 데이터 압축 후 클라우드로 전송
  3. 클라우드 서버가 요청 처리
  4. 응답 반환
  5. 로봇이 행동

이것은 여러 실패 지점이 있는 5단계다. 네트워크 정체? 로봇이 멈춤. 서버 과부하? 로봇이 대기. 인터넷 장애? 로봇이 비싼 문진이 됨. 그리고 계산 시간의 모든 밀리초와 데이터 전송의 모든 메가바이트에 대해 비용을 지불한다.

단일 가정용 청소기라면 이것은 견딜 만할 수 있다. 24시간 내내 가동되는 500대의 창고 로봇 함대라면? 클라우드 청구서만으로도 파산할 수 있고, 지연은 실시간 조정을 거의 불가능하게 만든다.

엣지 컴퓨팅 혁명이 로보틱스에 도달하다

FunctionGemma는 철학적 전환을 나타낸다: “로봇을 클라우드가 필요할 만큼 똑똑하게 만드는 방법"을 묻는 대신, 구글은 “클라우드를 로봇에 들어갈 만큼 작게 만드는 방법"을 묻고 있다.

이것은 전례가 없는 것이 아니다. 자동차 산업은 수년 전에 이것을 알아냈다 — 당신 차의 자동 비상 제동은 멈추기로 결정하기 전에 구글에 전화하지 않는다. 결정은 로컬에서, 밀리초 단위로 일어난다. 지연은 (말 그대로) 사람을 죽이기 때문이다. 하지만 지금까지 자연어 명령을 이해하고 행동으로 변환할 수 있는 AI 모델은 엣지 배포하기에는 너무 거대했다.

저렴한 로보틱스는 이렇게 생겼다

30만원짜리 홈 어시스턴트 로봇을 상상해 보라:

  • 일반적인 명령에 대한 완전한 자연어 이해
  • 월간 구독료 없음
  • 인터넷 장애 시에도 완벽하게 작동
  • 음성 데이터가 기기를 떠나지 않음
  • 명령에 즉각 응답

또는 휴대폰 신호가 전혀 없는 농장에서 작업할 수 있는 농업 로봇을 상상해 보라. 스타링크가 필요 없는 재난 대응 드론. 누군가에게 약을 먹으라고 상기시키기 위해 클라우드 구독이 필요 없는 노인 돌봄 동반자.

비용 절감은 모든 수준에서 복리로 작용한다. 더 저렴한 컴퓨팅 하드웨어는 더 저렴한 로봇을 의미한다. 클라우드 의존성이 없다는 것은 반복 비용이 없다는 것을 의미한다. 로컬 처리는 더 간단한 네트워크 요구 사항을 의미한다. 설계에 의한 프라이버시는 더 쉬운 규제 승인을 의미한다.

“교통 통제관” 아키텍처

구글은 FunctionGemma가 대규모 언어 모델을 완전히 대체할 수 있다고 주장할 만큼 순진하지 않다. 그들이 제안하는 아키텍처는 더 똑똑하다: FunctionGemma를 로컬 “교통 통제관"으로 사용하여 단순한 명령의 90%를 즉시 처리하고, 필요할 때만 복잡한 쿼리를 클라우드로 라우팅한다.

로봇에게 이것은 다음과 같이 보일 수 있다:

  • 로컬에서 처리: “앞으로 가”, “멈춰”, “빨간 물체를 집어”, “충전 스테이션으로 돌아가”
  • 클라우드로 라우팅: “이 특이한 물체를 분석해서 뭔지 알려줘”, “이 새로운 환경을 통과하는 최적 경로 계획해”

이 하이브리드 접근 방식은 일상적인 작업에 대해 엣지 컴퓨팅의 속도와 신뢰성을 제공하면서, 진정한 엣지 케이스에 대해 클라우드 규모 지능에 대한 액세스를 유지한다.

파인튜닝 요소

로보틱스에서 아마도 가장 중요한 측면은 FunctionGemma의 훈련 가능성이다. 기준 정확도 58%는 끔찍하게 들린다 — 그리고 범용 어시스턴트로서는 정말 그렇다. 하지만 로봇 명령과 동작의 특정 어휘에 파인튜닝하면 85%로 뛰어오른다.

로보틱스 회사가 자신들의 사용 사례에 맞게 특별히 파인튜닝하면 어떻게 될지 상상해 보라:

  • 창고 피킹 로봇: 50개의 핵심 명령, 최적화된 어휘, 정확도 잠재적으로 95% 이상
  • 배송 드론: 내비게이션 명령, 안전 오버라이드, 날씨 응답
  • 제조 암: 정밀한 동작 지시, 품질 관리 검사

각 로봇 유형은 필요에 완벽하게 맞춰진 맞춤형 AI 두뇌를 얻고, 만나게 될 어휘에 정확하게 훈련된다. 이것은 “모두를 지배하는 하나의 거대한 모델” 접근 방식의 반대다 — 모듈식이고, 효율적이며, 배포 가능하다.

로봇 제조업체에 대한 함의

로봇을 만드는 회사들에게 FunctionGemma는 전략적 변곡점을 나타낸다:

비용 구조가 변한다: 비싼 네트워크 하드웨어와 클라우드 연결 중복성이 필요 없으면 “스마트” 로봇의 자재 명세서가 수백 달러 떨어질 수 있다.

구독 모델이 죽는다: Robot-as-a-Service는 클라우드 의존성에 의존하여 고객을 반복 결제에 묶어둔다. 로컬 AI는 그 모델을 깬다 — 그리고 고객들은 알아챌 것이다.

신뢰성이 달성 가능해진다: 자율적으로 기능할 수 있는 로봇은 영웅적인 네트워크 인프라 없이 보장된 가동 시간을 의미한다.

프라이버시가 기능이 된다: 기기를 떠나지 않는 데이터는 해킹되거나, 유출되거나, 소환될 수 없다.

무엇이 빠져 있나

과대평가는 하지 말자. FunctionGemma에는 실제 한계가 있다:

  • 다단계 추론 없음: “박스를 집어서, 라벨을 확인하고, 올바른 통에 넣어"는 현재 능력을 벗어남
  • 간접 명령에 어려움: “방이 너무 밝아"는 조명 조정을 트리거하지 않음
  • 15% 오류율: 많은 애플리케이션에는 괜찮지만, 다른 것들에는 위험함

하지만 이것들은 알려진 해결책이 있는 소프트웨어 문제다. 다단계 추론은 chain-of-thought prompting이 하는 일이다. 간접 명령은 패러프레이즈에 대한 파인튜닝으로 처리할 수 있다. 오류율은 더 큰 훈련 데이터셋과 모델 반복으로 떨어질 것이다.

하드웨어 제약 — 그것이 어려운 문제다. 그리고 구글은 2억 7천만 파라미터가 실용적인 함수 호출에 충분하다는 것을 방금 증명했다. 그것이 돌파구다.

더 큰 그림

FunctionGemma가 혼자서 로봇 혁명을 만들지는 않을 것이다. 하지만 이것은 AI 산업이 절실히 필요로 했던 개념 증명이다: 기계를 유용하게 만들기 위해 조 단위 파라미터 모델이 필요하지 않다. 올바른 작업에 올바른 크기의 모델이 필요하다.

함의는 로보틱스를 넘어 IoT, 웨어러블, 의료 기기, 그리고 집에 전화하지 않고 결정을 내려야 하는 모든 것으로 확장된다. 하지만 로보틱스에 특히, 이것은 업계가 기다려온 순간처럼 느껴진다 — “스마트 로봇"이 더 이상 “비싼 로봇"을 요구하지 않는 순간.

저렴한 로보틱스의 미래는 클라우드에 있지 않다. 그것은 288메가바이트의 신중하게 훈련된 가중치에 있으며, 로컬에서 실행되고, 즉시 응답하며, 어디서나 작동한다. 구글은 방금 그것이 어떻게 보이는지 보여줬다. 이제 로봇 제조업체들이 그것을 만들 차례다.