UnitreeのG1ロボット、カンフーを卒業し「実用的な実務スキル」を習得

バク転やダンスといった「バズり動画」で世界を驚かせてきたUnitree Roboticsが、いよいよ「実用性」という本丸に攻め込んできた。同社は、ロボットに汎用的な操作能力を与える「身体性を持った脳(Embodied Brain)」、すなわちVision-Language-Action(VLA)モデルであるUnifoLM-VLA-0をオープンソースとして公開した。一言で言えば、彼らのロボットは今、あなたの「家事」を肩代わりするための学習を始めているのだ。

この新モデルの搭載により、Unitreeのヒューマノイドロボット「G1」は、あらかじめプログラムされたデモの枠を遥かに超える複雑なタスクを自律的にこなせるようになった。薬の瓶を開ける、テニスラケットとボールをケースに詰めてジッパーを閉める、さらにはペグボードに工具を整然と並べるといった動作だ。Unitreeによれば、このモデルは単一のポリシーで12カテゴリーに及ぶ複雑な操作タスクを安定して処理できるという。これは、真の意味での「汎用ロボット」に向けた極めて大きな一歩と言えるだろう。

この「身体性脳」のベースとなっているのは、アリババ(Alibaba)のQwenチームが開発した強力なオープンソース・ビジョン言語モデルQwen2.5-VL-7Bだ。Unitreeはこれに実機ロボットのデータを流し込み、追加の事前学習(Continued Pre-training)を施すことで、モデルに物理的な「常識」を叩き込んだ。コードとモデルウェイトを含むプロジェクトの全容は、現在GitHubで公開されている。 リンク:UnifoLM-VLA on GitHub

なぜこれが重要なのか?

Unitreeのこの動きが重要な理由は、大きく分けて2つある。第一に、極めて有能なVLAモデルをオープンソース化したことで、ヒューマノイドロボットの実用的なアプリケーション開発における参入障壁を劇的に下げたことだ。これは、一部の競合他社が好む「クローズドなエコシステム」に対する真っ向からの挑戦状でもある。

第二に、そしてより決定的なのは、この高度なAIが「衝撃的なほど安価なハードウェア」と組み合わされている点だ。Unitree G1の価格はわずか1万6000ドル(約240万円〜)から。これはライバルたちの多くと比較して、桁が一つ違うほどの破壊的なプライシングだ。より高度な「EDUバージョン」は高価になるものの、ベースモデルの価格設定は、学術機関から企業のR&D部門まで、幅広い層の手が届く範囲にある。安価で高性能な機体と、無料のオープンソースAI脳。この強力な組み合わせは、ロボット工学の進化をこれまでにないスピードで加速させるだろう。「ロボット執事」の時代は、もはやSFの空想ではなく、極めて現実的な未来へと一気に近づいた。