Új NIST tesztek: Hasznosak-e valójában a humanoid robotok?

Az amerikai National Institute of Standards and Technology (NIST) úgy döntött, ideje véget vetni a jól vágott marketingvideók korának, és kideríteni, mire mennek a csillogó-villogó humanoid robotok a zord valóságban. Az ügynökség egy új, „Baseline Performance Benchmark” névre keresztelt szabványosított mérési rendszert javasol – egy olyan akadálypályát, amely a valódi képességeket hivatott tesztelni. Közel tíz év telt el azóta, hogy a DARPA Robotics Challenge (DRC) utoljára komoly, és valljuk be, sokszor megalázó próbatétel elé állította ezeket a gépeket.

Még 2013-2014 környékén a DRC szolgáltatta a netes robot-bakiparádék legjavát, egyben kíméletlenül emlékeztetett minket arra, hogy egy olyan egyszerű feladat, mint egy ajtó kinyitása, mekkora kihívás elé állítja a mesterséges intelligenciát. A NIST, amely az eredeti teszteket is tervezte, most egy modern utódot dobna be a köztudatba. A cél az, hogy legyen egy közös, számszerűsíthető feladatsor, amit minden, magára valamit is adó kereskedelmi humanoidnak teljesítenie kell. A javasolt tesztek négy kulcsfontosságú területet fednek le: Mobilitás (lépcsők, rámpák), Manipuláció (kilincsek elforgatása, szerszámhasználat), Loko-manipuláció (például egy láda átcipelése egy ajtón) és Kogníció (többlépcsős feladattervezés).

A javasolt NIST humanoid robot benchmark feladatlistája

A NIST az iparági szereplőkkel szoros együttműködésben fejleszti a tesztkörnyezetet, és azt tervezi, hogy korlátozott számban ingyenes fizikai tesztállomásokat biztosít a részt vevő amerikai robotgyártóknak. Az ügynökség aktívan várja a visszajelzéseket a robotikai közösségtől, gyakorlatilag arra kérve az olyan cégeket, mint a Boston Dynamics, a Figure AI vagy a Tesla, hogy segítsenek megszerkeszteni azt a mérőrudat, amellyel aztán őket fogják mérni.

Miért olyan fontos ez?

Évek óta a gondosan megkomponált demóvideók uralják a robotikai közbeszédet, amelyek steril körülmények között mutatnak hibátlan teljesítményt. Eddig nem létezett szabványosított módszer arra, hogy összehasonlítsuk két cég gépének tudását, így a vásárlók és a befektetők csak találgathattak, kinél van valódi technológiai tartalom, és kinél csak egy zseniális vágó. Ez a NIST-benchmark végre átvághatja a hype-ot.

Az ismételhető és mérhető feladatok létrehozásával a NIST egyenlő pályát teremt mindenki számára. Ez lehetővé teszi a robotok teljesítményének közvetlen, „almát az almával” típusú összehasonlítását, elválasztva a valóban bevethető gépeket a laboratóriumi prototípusoktól. Egy olyan iparágban, amely épp a tömeges piaci megjelenés küszöbén áll, az ilyen típusú objektív hitelesítés nem csupán hasznos – elengedhetetlen a bizalom felépítéséhez és a valódi fejlődés felgyorsításához. A részleteket az hivatalos javaslatban lehet böngészni.