NVIDIA GR00T N1 wprowadza erę uniwersalnej robotyki

Rewolucja Robotyczna jest Open Source: NVIDIA GR00T N1 Inauguruje Erę Robotyki Generalistycznej

W przestronnym SAP Center w San Jose, wśród elektryzującego oczekiwania tysięcy programistów i technologów, CEO NVIDIA Jensen Huang przeszedł przez scenę w swojej ikonicznej skórzanej kurtce, zatrzymując się dramatycznie, zanim obwieścił: “Era robotyki generalistycznej nadeszła”. To oświadczenie, wygłoszone podczas konferencji NVIDIA GTC 2025 we wtorek, było czymś więcej niż hiperbolą—było odsłonięciem czegoś, co może stać się momentem Androida dla robotyki: NVIDIA Isaac GR00T N1, pierwszy na świecie otwarty podstawowy model dla robotów humanoidalnych.

Mózg dla Każdego Ciała: Demokratyzacja Inteligencji Robotów

Stojąc w wyraźnym kontraście do własnościowych systemów AI, które dominują dzisiejsze nagłówki, GR00T N1 reprezentuje fundamentalnie inne podejście do inteligencji robotów—oparte na otwartości, dostępności i wizji robotów, które mogą generalizować w różnych środowiskach i zadaniach bez specjalistycznego programowania dla każdego scenariusza.

“Dzięki NVIDIA Isaac GR00T N1 oraz nowym ramom do generowania danych i uczenia robotów, deweloperzy robotyki na całym świecie otworzą nową granicę w erze AI,” powiedział Huang wypełnionej arenie podczas swojego przemówienia, które trwało ponad dwie godziny. Ta wypowiedź podsumowuje ambitną strategię NVIDIA: stworzyć podstawową inteligencję, która będzie napędzać następną generację robotów humanoidalnych, a następnie udostępnić ją bezpłatnie deweloperom na całym świecie.

Co czyni to ogłoszenie szczególnie znaczącym, to sposób, w jaki adresuje najbardziej uporczywe wyzwanie w robotyce—skalowalność danych treningowych. Jak wyjaśnił Jim Fan, Senior Research Manager i Lead of Embodied AI w NVIDIA, w poście na LinkedIn po prezentacji: “Naszą misją jest demokratyzacja Fizycznej AI. Moc ogólnego mózgu robota na wyciągnięcie ręki—mając zaledwie 2 miliardy parametrów, N1 uczy się z najbardziej zróżnicowanego zbioru danych akcji fizycznych, jaki kiedykolwiek skompilowano, i bije znacznie powyżej swojej wagi.”

Robot Myślący Szybko i Wolno

Sercem GR00T N1 jest dwusystemowa architektura inspirowana ludzkim poznaniem—to, co NVIDIA nazywa myśleniem “szybkim i wolnym”. Podejście to czerpie z teorii nauk kognitywnych, które dzielą ludzkie myślenie na dwa systemy: intuicyjne, automatyczne reakcje oraz celowe, metodyczne rozumowanie.

“System 2”, komponent wolnego myślenia, wykorzystuje model języka wizualnego do postrzegania i rozumowania o środowisku robota i otrzymywanych instrukcjach, a następnie planuje odpowiednie działania. “System 1”, komponent szybkiego myślenia, przekłada te plany na precyzyjne, ciągłe ruchy robota z częstotliwością wykonania 120Hz. Ta architektura pozwala robotom obsługiwać złożone zadania wymagające zarówno deliberacji, jak i płynnego ruchu—podnoszenie przedmiotów, manipulowanie nimi jedną lub obiema rękami oraz wykonywanie wieloetapowych sekwencji.

W demonstracji, która wyraźnie podekscytowała publiczność, Huang pokazał humanoidalnego robota Neo firmy 1X autonomicznie wykonującego zadania porządkowe w gospodarstwie domowym przy użyciu polityki zbudowanej na GR00T N1. Płynne ruchy robota i widoczne zrozumienie jego otoczenia podkreśliły potencjał modelu do praktycznych zastosowań.

Przełamując Barierę Danych za pomocą Syntetycznej Rzeczywistości

Być może najbardziej rewolucyjnym aspektem podejścia NVIDIA jest sposób, w jaki rozwiązuje fundamentalny problem danych w robotyce. Podczas gdy modele językowe mogą trenować na ogromnym korpusie tekstu dostępnym w internecie, uczenie robotów tradycyjnie było ograniczone przez ograniczenia świata fizycznego—ludzki demonstrator może wygenerować tylko 24 godziny danych treningowych dziennie.

“Dane z demonstracji ludzkich są ograniczone liczbą godzin w ciągu dnia,” wyjaśnił narrator w filmie wprowadzającym NVIDIA GR00T N1. Aby przezwyciężyć to ograniczenie, NVIDIA opracowała struktury do wykładniczego mnożenia demonstracji ze świata rzeczywistego w ogromne syntetyczne zbiory danych.

Używając pierwszych komponentów NVIDIA Isaac GR00T Blueprint, firma wygenerowała 780 000 syntetycznych trajektorii—równoważnych dziewięciu ciągłym miesiącom ludzkich demonstracji—w zaledwie 11 godzin. W połączeniu z rzeczywistymi danymi, ten syntetyczny zestaw danych poprawił wydajność GR00T N1 o 40% w porównaniu do korzystania wyłącznie z rzeczywistych danych.

Podejście to wykorzystuje trzy źródła danych: rzeczywiste dane z teleoperacji humanoidalnych (zbierane za pomocą systemów takich jak Apple Vision Pro do immersyjnej kontroli), dane z symulacji na dużą skalę (które NVIDIA udostępnia jako open source z ponad 300 000 trajektorii) oraz to, co Fan nazywa “trajektoriami neuronowymi”—używanie najnowocześniejszych modeli generowania wideo do “halucynowania” nowych syntetycznych danych z dokładną fizyką.

“Używając słów Jensena, ‘systematycznie nieskończone dane’!” zauważył Fan w swoim poście, odnosząc się do charakterystyki Huanga dotyczącej tego podejścia do generowania danych.

Moment Gwiezdnych Wojen: Blue Kradnie Show

W momencie, który sprawił, że widownia sięgnęła po telefony, Huang przedstawił “Blue”, charyzmatycznego robota, który wygląda, jakby wyszedł prosto z filmu Gwiezdne Wojny. Dwunożny droid, przypominający R2-D2, ale z własną wyrazistą osobowością, chodził wokół Huanga, ekspresyjnie piszczał i kiwał głową ku uciesze publiczności.

“Powiedzcie, że to nie było niesamowite,” powiedział Huang przy aplauzie, gdy Blue demonstrował swoje możliwości. Robot nie był tylko na pokaz—demonstrował nowe partnerstwo NVIDIA z Google DeepMind i Disney Research w celu zbudowania nowego silnika fizyki open-source o nazwie Newton.

“Potrzebujemy silnika fizyki, który jest zaprojektowany do bardzo dokładnych, sztywnych i miękkich ciał, zaprojektowany do możliwości trenowania informacji zwrotnej dotykowej oraz umiejętności motoryki precyzyjnej i sterowania siłownikami,” wyjaśnił Huang. Silnik Newton, zbudowany na frameworku NVIDIA Warp, będzie zoptymalizowany do uczenia robotów i kompatybilny z frameworkami symulacyjnymi, takimi jak MuJoCo od Google DeepMind i NVIDIA Isaac Lab.

Kyle Laughlin, starszy wiceprezes Walt Disney Imagineering Research & Development, dostarczył kontekst dla zaangażowania Disneya: “Droidy BDX to dopiero początek. Jesteśmy zobowiązani do ożywiania większej liczby postaci w sposób, jakiego świat jeszcze nie widział, a ta współpraca z Disney Research, NVIDIA i Google DeepMind jest kluczową częścią tej wizji.”

Szansa Warta 10 Bilionów Dolarów

Stawki w tej rewolucji robotycznej są ogromne. Huang opisał roboty jako “następną branżę wartą 10 bilionów dolarów”, odpowiadającą na globalne niedobory siły roboczej szacowane na ponad 50 milionów ludzi.

Dla firm rozwijających roboty humanoidalne, GR00T N1 oferuje znaczący start. Zamiast budować inteligencję robotów od podstaw, deweloperzy mogą wykorzystać model podstawowy NVIDIA i dostosować go do konkretnych robotów lub zadań poprzez szkolenie po-treningowe.

Bernt Børnich, CEO 1X Technologies, jednego z pierwszych partnerów korzystających z GR00T N1, podkreślił tę zaletę: “Model GR00T N1 firmy NVIDIA stanowi przełom dla rozumowania i umiejętności robotów. Z minimalną ilością danych po-treningowych byliśmy w stanie w pełni wdrożyć go na NEO Gamma—realizując naszą misję tworzenia robotów, które nie są narzędziami, ale towarzyszami, którzy mogą pomagać ludziom w znaczący, niezmierzony sposób.”

Inni wiodący deweloperzy robotów humanoidalnych z wczesnym dostępem to Agility Robotics, Boston Dynamics, Mentee Robotics i NEURA Robotics.

Cross-Embodiment: Nieoczekiwany Zwrot

Podczas gdy roboty humanoidalne są głównym celem GR00T N1, Fan ujawnił intrygującą funkcję: wsparcie dla cross-embodiment. “Dostrajamy go do pracy na ramieniu robota HuggingFace LeRobot SO100 za 110 dolarów!” napisał. Pokazuje to, że korzyści modelu podstawowego mogą wykraczać poza drogie platformy humanoidalne i obejmować bardziej dostępny sprzęt.

Podekscytowanie Fana tą innowacją było widoczne w jego konkluzji: “Otwarty mózg robota działa na otwartym sprzęcie. Brzmi właściwie. Rozwiążmy razem robotykę, token po tokenie.”

Droga Przed Nami

Model GR00T N1, dane treningowe i scenariusze ewaluacji zadań są już dostępne na Hugging Face i GitHubie, z NVIDIA Isaac GR00T Blueprint do syntetycznego generowania ruchu manipulacyjnego dostępnym jako interaktywne demo na build.nvidia.com.

Dla deweloperów chcących pracować z tymi modelami, NVIDIA ogłosiła również osobisty superkomputer AI DGX Spark, zapewniający system pod klucz do rozszerzania możliwości GR00T N1 dla nowych robotów, zadań i środowisk bez rozległego niestandardowego programowania.

Silnik fizyki Newton ma być dostępny jeszcze w tym roku, dalej rozszerzając zestaw narzędzi dla deweloperów robotyki.

Demokratyzacja Fizycznej AI

To, co wyróżnia podejście NVIDIA, to nacisk na otwartość i dostępność. Udostępniając GR00T N1 i powiązane narzędzia szerokiemu gronu odbiorców, NVIDIA pozycjonuje się nie jako jedyny budowniczy inteligencji robotów, ale jako warstwa fundamentalna, na której globalna społeczność deweloperów może wprowadzać innowacje.

W miarę jak robotyka przechodzi od specjalistycznych zastosowań przemysłowych do ogólnych możliwości w różnorodnych środowiskach, otwarte podejście NVIDIA mogłoby przyspieszyć innowacje w sposób podobny do tego, jak oprogramowanie open-source przekształciło informatykę. Firma, która zbudowała swoją reputację na przetwarzaniu grafiki dla gier, teraz kładzie podwaliny pod przyszłość, w której inteligentne roboty są tak wszechobecne jak dzisiejsze smartfony.

W społeczności robotycznej reakcje na GR00T N1 były entuzjastyczne, choć pozostaje pewien sceptycyzm co do obecnych ograniczeń sprzętu robotycznego. Jak zauważył jeden z założycieli firmy robotycznej w odpowiedzi na wcześniejszą aktualizację GR00T: “byłoby dobrze, gdyby sprzęt robotyczny był porównywalny z ludzkim. Ale nie jest. Bolączką jest to, że roboty są niezgrabnymi, niezręcznymi przybliżeniami i daleko im do ludzkiego odpowiednika.”

Niemniej jednak, wizja NVIDIA jest jasna: jeśli roboty mają stać się naprawdę wszechstronne i użyteczne w niezliczonych scenariuszach ludzkiego życia, potrzebują generalistycznej inteligencji, która może szybko dostosować się do nowych środowisk i zadań. Dzięki GR00T N1, ta przyszłość właśnie zbliżyła się o znaczący krok.

“Era robotyki generalistycznej jest tutaj,” ogłosił Huang. Dla dziedziny, która często obiecywała więcej niż dostarczała, systematyczne podejście NVIDIA do inteligencji robotów—łączące modele podstawowe, generowanie danych syntetycznych i otwartą współpracę—reprezentuje być może najbardziej wiarygodną ścieżkę do urzeczywistnienia tej deklaracji.