1Xの新型AIが未来を予測、ロボットはマトリックスで練習可能に

猫をホコリ取りと間違えないように、数百万ドルもする人型ロボットにどうやって教えるか考えたことはありますか?あるいは、キャビネットのドアを蝶番ごと引き剥がすことなく、頑固なピクルスの瓶の蓋を開ける方法をどう学ぶのでしょうか?現実世界で練習させて、滑稽で(そして高価な)NG集を積み上げるのに一生を費やすこともできます。

あるいは、ロボット工学会社の1Xのように、ロボットのために『マトリックス』を構築するという手もあります。

本日、1Xは**1Xワールドモデル(1XWM)**を発表しました。これは、原子の世界とビットの世界の架け橋となる画期的なAIです。これは、NEO人型ロボットがあなたの家で一歩踏み出す前に、デジタルな遊び場で練習し、失敗し、学ぶことを可能にする、高忠実度シミュレーターであり、未来を予測できます。

これは単なるビデオゲームエンジンではありません。これはロボット工学のための水晶玉であり、真に自律的なアンドロイドを開発する上での最大のボトルネックの1つを解決するために設定されています。

問題:現実世界でのテストは面倒くさい

1Xの究極の目標は、NEOロボットを想像しうる最も混沌とした環境、つまり私たちの家庭に配備することです。そこでは、車のキーが不可解にテレポートし、家具が気まぐれに入れ替えられ、あの特定のタッパーウェアの蓋が2019年から行方不明になっています。

ロボットのプログラミング(または「ポリシー」)をあらゆる可能性のあるシナリオに対してテストすることは、物理的に不可能です。ごちゃごちゃしたキッチンを何百万通りも模倣することはできません。1Xが言うように、「各ポリシーを物理的に評価するには…何世代もの時間がかかるでしょう。」

1XWM:ロボットのためのデジタルの水晶玉

1Xワールドモデルがその答えです。これは、部屋の数フレームのビデオといった現実世界の開始点を取り込み、ロボットの特定のアクションに基づき、次に何が起こるかを予測します。

そして、ここが典型的な「テキストからビデオへ」のAIとの決定的な違いです。1XWMはアクション制御可能です。「カウンターを掃除して」のような曖昧なプロンプトを与えるのではなく、ロボットからの正確な低レベルのアクション軌道――関節の正確な角度、腕の速度、握る力――をフィードします。モデルは、布が表面を拭く物理特性や、ドアが蝶番で開く様子に至るまで、その結果をシミュレーションします。

その結果は驚異的です。このモデルは、同じ開始点から複数の異なる未来を生成でき、NEOがマグカップを掴んだ場合と、例えば、架空のギターを弾いた場合とで何が起こるかを示します。これにより、1Xは実際の物体を一つも動かすことなく、AIをストレステストし、数百万回の実験を短時間で実行できるようになります。

マトリックスを専門用語抜きで:クイックガイド

赤いピルを飲んだ気分ですか?主要な用語を分解してみましょう。

「ワールドモデル」とは? AIの内部的な想像力のようなものです。これは世界がどのように機能するかをシミュレートするもので、AIが特定のアクションを実行した場合に「次に何が起こるか」を予測できるようにします。これは、試行錯誤から学ぶことと、事前に結果を熟考することの違いです。

「ロボットポリシー」とは? 簡単な言葉で言えば、ロボットの脳または意思決定戦略です。これは、ロボットが見たり聞いたり感じたりしたものに基づいて、どの行動をとるかを指示する複雑なルールのセットです。ワールドモデルは、どの「ポリシー」が最適かを迅速に評価するために使用されます。

「アクション制御可能」とはどういう意味ですか? シミュレーションが、一般的なテキストコマンドではなく、ロボットの正確で精密な動きによって導かれるという意味です。これは物理学を現実に即してシミュレートするために不可欠です。モデルは、ロボットがドアを押そうとしているのか、引こうとしているのかを知る必要があります。

「固有受容感覚(Proprioception)」とは? それはロボット自身の身体感覚です。自分自身を「見る」必要なしに、手足がどこにあるか、関節がどのような角度になっているか、空間をどのように移動しているかを知っています。これは人間でいう触覚やバランス感覚ですが、ロボットのためのものです。1Xは、固有受容感覚を使用したポリシーが大幅にパフォーマンスが向上することを発見しました。

「反実仮想(Counterfactuals)」とは何ですか? これらは「もし~だったら」というシナリオです。ワールドモデルは、ロボットが現実世界で失敗した状況を取り上げ、もし別の行動をとっていたら「何が起こったか」をシミュレートできます。ロボットのトレーニングのためのタイムマシンのようなものです。

バーチャル練習から現実世界の知性へ

では、このデジタルな空想は、実際にロボットをより良くするのでしょうか?1Xによれば、答えは断固として「イエス」です。

ワールドモデルの予測と現実世界の結果の間には高い相関関係があります。シミュレーターがAIのあるバージョンが別のバージョンよりもタスクに優れていると予測した場合、現実世界での評価はその予測が正しいことを証明しました。この即時フィードバックループは革命的であり、彼らが次のことを可能にします。

  • 最良の頭脳の選択: 長時間の物理テストなしに、トレーニング実行から最もパフォーマンスの高いAIモデルを迅速に選出します。
  • 過ちからの学習: 現実世界の失敗のデータセットをキュレーションし、モデルを使用してロボットが代わりに何をすべきだったかを掘り下げます。
  • 学習のスケールアップ: モデルが見るデータが増えれば増えるほど、賢くなります。あるタスクから別のタスクへ知識を転送することさえできます――棚の扱いが上手になることは、アーケードゲーム機の理解に役立ちます。

もちろん、完璧ではありません。1Xは限界について透明性を持っています。このモデルは現在、これまで見たことのない物体との相互作用をシミュレートするのに苦労しています。しかし、トレーニングデータの量が増えるにつれて、この「想像力のギャップ」は縮小すると予想されています。

未来は合成である

1Xにとっての最終目標は、計り知れないものです。彼らは、十分に高度なワールドモデルが、現実世界のデータと見分けがつかない合成データを生成できると信じています。

そうなれば、何十年もの間ロボット工学を悩ませてきたデータボトルネックは消滅するかもしれません。何年もデータを集める必要はなくなり、モデル内部で無限に、完全に調整されたトレーニングシナリオを生成できるようになります。

1Xのチームが述べているように、「データと評価は自律性を解決するための礎であり、1XWMは両方の課題に取り組むための統一された道筋を提供します。」

それは大胆なビジョンです。アンドロイドが現実世界だけでなく、それ自身のデジタル世界、つまり私たちの世界への準備をするマトリックスの中で訓練される未来です。そしていつものように、RoboHorizon Magazineは、そのシミュレートされた未来が私たちの現実になる経緯を報道し続けます。