1XのNEOロボット、動画視聴で学習 - 面倒な訓練不要

ロボット業界には、あまり公には語られない「裏事情」がある。それは、ロボットに何か役立つことを教え込むのが、気が遠くなるほど遅く、そして天文学的なコストがかかるという現実だ。長年、業界の通説は「視覚言語行動モデル(VLA)」なる力技で知能を叩き込むというものだった。これは、人間が何万時間もかけて、あらゆる想定されるタスクでロボットをまるで操り人形のように手取り足取り操作するという、途方もない手間暇を要する荒業だ。まさに、データボトルネックの極致と言えるだろう。

しかし今、ロボット企業「1X」は、まさに異端、いや、革命と呼ぶべき解決策を提示している。彼らが開発したヒューマノイド「NEO」への新しいアプローチは、見かけによらずシンプルだ。それは、面倒な手取り足取りの訓練をやめ、ロボットに、我々がインターネットと呼ぶ、広大で混沌とし、しかし驚くほど教育的な人間の行動ライブラリをただ見せるだけで学習させるというもの。これは単なるアップグレードではない。ロボットがスキルを習得する方法における、根本的なパラダイムシフトなのだ。

昨日の「データ食い荒らしの獣」

1Xが成し遂げようとしている飛躍を理解するには、まず現状を把握する必要がある。FigureHelixからNVIDIAの*GR