ロボット工学界隈に、期待と焦燥が入り混じった激震が走っている。NVIDIAが、ヒューマノイドロボット向けの基盤モデル「SONIC」をオープンソース化したのだ。これまでヒューマノイドといえば、事前にプログラミングされた華麗なアクロバットを披露する「見せ物」の域を出なかったが、SONICはその常識を根底から覆そうとしている。NVIDIAの研究員、Yuke Zhu氏が語る目標は明確だ。業界の「単一機能への固執」を脱却し、「汎用ヒューマノイドに実社会での労働を担わせる」ことにある。そう、ついにロボットが「仕事」をする時代の幕開けだ。
SONIC(Supersizing mOtion tracking for Natural humanoId Control)は、リアルタイムで全身の動作を生成する「行動基盤モデル(Behavior Foundation Model)」である。その学習データは圧倒的だ。1億フレームを超える人間によるモーションキャプチャ・データ、時間にして700時間分以上もの「走る」「跳ぶ」「這う」といった動作を学習させている。これにより、開発者が頭を悩ませてきたタスクごとの「報酬エンジニアリング(報酬設計)」を必要とせず、ロボットに自然な動きの基礎を叩き込むことに成功した。さらに、テレオペレーション(遠隔操作)による直接制御と、Vision-Language-Action(VLA)モデルからの推論の両方をサポートしており、単一の統合されたポリシーでロボットを自在に操ることができる。
驚くべきは、これが単なる理論に留まらない点だ。あるベータテスターの報告によれば、わずか数時間でシステムの実装を完了し、そのパフォーマンスを「極めて優秀」と評している。コントローラーの微調整に数ヶ月を費やすのが当たり前だったこの分野において、「数時間でのセットアップ」はもはや魔法に近い。
なぜこれが重要なのか?
長年、ヒューマノイドロボットは「デモの無限ループ」に陥っていた。派手な身体能力は見せつけるものの、実用的なアプリケーションには結びつかない「脆い器」だったのである。NVIDIAが強力な汎用コントローラーをオープンソース化したことは、ヒューマノイドの「基本動作」を事実上コモディティ化することを意味する。これにより、スタートアップや研究者は「どう動かすか」という車輪の再発明に時間を取られることなく、より高度な「推論」や「タスク実行」の開発にリソースを集中できるようになる。
これは、次世代ロボットのための標準ソフトウェアおよびAIプラットフォームを構築しようとするNVIDIAの広大な戦略「Project GR00T」とも深く結びついている。SNSでの「いいね」を稼ぐためのバク転の時代は、ようやく終わりを告げようとしている。その先に待っているのは、地味ではあるが無限の価値を持つ、――例えば「皿洗い」を完璧にこなすロボットたちの時代だ。













