Le National Institute of Standards and Technology (NIST) américain a décidé qu’il était temps de vérifier si la nouvelle garde des robots humanoïdes sait faire autre chose que de la figuration dans des vidéos marketing ultra-léchées. L’agence vient de proposer un nouveau « Baseline Performance Benchmark », un véritable parcours du combattant standardisé conçu pour mesurer les capacités réelles des humanoïdes, près de dix ans après que le DARPA Robotics Challenge (DRC) a soumis ces machines à leur dernier test sérieux (et parfois humiliant).
Souvenez-vous, en 2013-2014 : le DRC nous avait offert une mine d’or de bêtisiers robotiques, nous rappelant cruellement qu’ouvrir une simple porte reste un défi herculéen pour une pile de servomoteurs. Le NIST, qui avait conçu ces tests originaux, propose aujourd’hui un équivalent moderne. L’objectif est d’établir un ensemble de tâches quantifiables que n’importe quel robot commercial digne de ce nom devrait être capable d’exécuter. Les tests proposés couvrent quatre domaines clés : la mobilité (escaliers, rampes), la manipulation (tourner des poignées, utiliser des outils), la loco-manipulation (transporter un bac en passant une porte) et la cognition (planification de tâches par étapes).

Le NIST développe actuellement ce dispositif de test en collaboration avec les acteurs du secteur et prévoit de distribuer gratuitement un nombre limité de ces plateformes physiques aux fabricants de robots américains participants. L’agence sollicite activement l’avis de la communauté robotique sur la conception des épreuves, demandant concrètement à des entreprises comme Boston Dynamics, Figure AI et Tesla de contribuer à fabriquer le mètre étalon avec lequel elles seront jugées.
Pourquoi est-ce crucial ?
Pendant des années, l’industrie de la robotique a été dominée par des démos soigneusement chorégraphiées, affichant des performances impeccables dans des conditions parfaites. Il n’existait aucun moyen standardisé de comparer les capacités d’un robot par rapport à un autre, laissant les clients et les investisseurs dans le flou : qui possède une technologie solide et qui possède simplement un excellent monteur vidéo ? Ce benchmark du NIST pourrait enfin briser le miroir aux alouettes.
En créant un ensemble de tâches répétables et mesurables, le NIST instaure des règles du jeu équitables. On pourra enfin comparer ce qui est comparable, et séparer les machines réellement opérationnelles des prototypes de laboratoire. Pour une industrie à l’aube d’un déploiement commercial massif, cette validation objective n’est pas seulement utile : elle est indispensable pour instaurer la confiance et piloter un véritable progrès technique. Vous trouverez plus de détails dans la proposition officielle.

