Lejos de las coreografías milimétricas pero rígidas a las que nos tienen acostumbrados, un equipo de investigadores ha presentado OmniXtreme, una política de IA generalista que permite a un robot humanoide encadenar saltos mortales, mantener el equilibrio en posturas imposibles e incluso marcarse unos pasos de breakdance. Esta nueva capacidad, demostrada en un robot G1 de Unitree Robotics, va mucho más allá de las demostraciones “sobreajustadas” (overfitted) que solemos ver —como la impresionante pero limitada actuación del WuBOT en la Gala del Festival de Primavera de 2026— para adentrarse en el terreno de un atletismo robótico verdaderamente versátil.
Este proyecto de un año, desarrollado en colaboración con Unitree, no ha salido precisamente barato. El equipo de investigación reconoce haber “sacrificado docenas de robots G1” hasta dar con la tecla del movimiento dinámico general. Teniendo en cuenta que el precio de salida del G1 ronda los 13.500 $, estamos ante una ofrenda considerable de hardware a los dioses del aprendizaje por refuerzo (reinforcement learning). El objetivo era derribar el muro que separa a los modelos entrenados para seguir un movimiento específico de aquellos capaces de gestionar la caótica física de las maniobras extremas en el mundo real.
El ingrediente secreto es un método de entrenamiento en dos etapas. Primero, se preentrena una política de control generativo basada en flujos (flow-based), que dota al robot de una comprensión fundamental del movimiento. Después, se somete a un post-entrenamiento mediante “RL residual consciente de la actuación”, un paso crítico que ajusta el modelo para tener en cuenta las complejas dinámicas y las limitaciones físicas de un robot real. Los investigadores afirman que esta segunda fase fue la clave para trasladar con éxito la política de la simulación a la realidad (el siempre espinoso sim-to-real). En un gesto que beneficia a toda la comunidad, los checkpoints del modelo se han publicado en GitHub.
¿Por qué es esto un hito?
El desarrollo de una política única y unificada para una gama tan amplia de movimientos de alto impacto es un avance fundamental. Marca la transición de los “especialistas” robóticos —capaces de ejecutar un solo truco espectacular— a los “generalistas” con un repertorio físico envidiable. Al superar con éxito el abismo entre la simulación y la realidad para dinámicas extremas, OmniXtreme ofrece un marco sólido para crear humanoides más robustos, adaptables y físicamente competentes. La liberación de estos modelos probablemente acelerará la carrera por crear a los gimnastas y bailarines robóticos del futuro.













