「動画で学ぶロボット」Rhoda AIが始動、4.5億ドル調達で評価額17億ドルに

AIブームの熱狂は、まだ序の口に過ぎなかったようだ。

ロボット・インテリジェンスの新星、Rhoda AIが、18ヶ月に及ぶステルス期間を経て、ついにそのベールを脱いだ。同社は発表と同時に、4億5000万ドル(約675億円)という、シリーズAとしては破格の巨額資金調達を公表。Premji Investが主導したこの投資により、パロアルトを拠点とする同社の評価額は早くも**17億ドル(約2550億円)**に達し、一躍ユニコーン企業の仲間入りを果たした。彼らの野望は明快だ。インターネット上の膨大な動画データを「教科書」として、産業用ロボットに汎用的な「脳」を授けることにある。

Rhoda AIが開発したプラットフォーム「FutureVision」は、ロボティクス界が長年抱えてきた難題に真っ向から挑んでいる。それは、あらかじめプログラムされた動作しかできない従来のロボットを、予測不能な現実世界の「カオス」に適応させることだ。

同社の「隠し玉」は、Direct Video Actionと呼ばれるモデルにある。これまでのように人間が遠隔操作してデータを地道に覚え込ませるのではなく、YouTubeなどインターネット上に転がる数億本もの公開動画をAIに事前学習させるのだ。これにより、AIは物理法則や物体の動き、相互作用といった「世界の仕組み」を基礎教養として身につける。この知識を少量のロボット専用データで微調整(ファインチューニング)することで、製造や物流の現場で予期せぬ事態が起きても、臨機応変に対応できるシステムを構築した。

非構造化された膨大な動画データから汎用AIモデルを構築するこのアプローチは、従来のロボティクスの常識を覆すものだ。むしろ、NVIDIATeslaといった巨人が推し進める「基盤モデル」の戦略に近い。Teslaが人型ロボット「Optimus」や自動運転AIの訓練に実走行データを用いる一方で、NVIDIAは「Isaac」プラットフォームや人型ロボット向け基盤モデル「GR00T」でエコシステムの覇権を狙っている。Rhoda AIの立ち位置は、特定のハードウェアに依存しない「OS(脳)」のプロバイダーだ。既存のあらゆるロボット艦隊を、後付けでアップグレード可能な「知能」で武装させようとしている。

なぜこれが重要なのか?

ソフトウェア特化型の企業に対し、シリーズAでこれほどの巨額資金が投じられた事実は、Premji InvestKhosla VenturesTemasekといった百戦錬磨の投資家たちが、自動化の真の価値は「ハードウェア(腕やグリッパー)」ではなく、それを動かす「AI(脳)」にあると確信している証左だ。

インターネットという混沌とした情報の海でロボットを鍛え上げることで、Rhoda AIは、従来のプログラミングというボトルネックを飛び越えようとしている。もしFutureVisionが、YouTubeで学んだ知識を工場のフロアで実行可能なアクションに完璧に翻訳できるなら、これまで「人間にしかできない」とされてきた複雑な作業の自動化コストは劇的に下がるだろう。

それは、高性能な「肉体(ロボット)」が溢れる未来において、そのすべてを支配する「Android(OS)」を構築しようとする、極めて大胆な挑戦である。