New AI Sim Runs 10-Minute Robot Tasks at 15 FPS on an RTX 4090


Мировые модели в робототехнике часто демонстрируют физическую консистенцию промокшего бумажного пакета при длительных симуляциях. Новый проект под названием Interactive World Simulator призван изменить эту ситуацию: он способен генерировать более 10 минут стабильного интерактивного видео при 15 FPS, и всё это работает на одной-единственной видеокарте NVIDIA, Inc. RTX 4090. Да, вы правильно прочитали. Десять минут сложной физики, плавно работающие на потребительском GPU.

Разработанная исследователем Икусюаном Ваном (Yixuan Wang) модель мира, управляемая действиями, — это не просто заранее отрисованное видео; это полностью интерактивная симуляция, которой можно «управлять» в реальном времени. Самое впечатляющее? Вы можете попробовать сами прямо сейчас в демо прямо в браузере — без Python-библиотек и мучений с pip install. Модель справляется с целым рядом задач, требующих контакта: от аккуратной прокладки кабелей до сметания гор предметов, и всё это генерируется чисто в пиксельном пространстве. Это не видео с реальной камеры — это открытые предсказания самой модели.

Почему это важно?

Это не просто крутая технологическая демонстрация; это потенциальное решение двух главных головных болей в робототехнике. Во-первых, это позволяет масштабировать генерацию данных. Вместо того чтобы полагаться на медленных и дорогостоящих реальных роботов для сбора обучающих данных, разработчики могут генерировать горы физически достоверных данных внутри симулятора. Во-вторых, это обеспечивает точную оценку политик, позволяя исследователям тестировать и совершенствовать «мозг» робота в безопасном, последовательном и бесконечно воспроизводимом виртуальном мире, прежде чем вообще прикасаться к реальному оборудовании. одним словом, это делает обучение роботов дешевле, быстрее и с меньшей вероятностью того, что многотысячный манипулятор пробивает дыру в стене.