Robotska revolucija je otvorenog koda: NVIDIA GR00T N1 uvodi eru univerzalne robotike

U prostranom SAP Centru u San Hoseu, usred električnog iščekivanja hiljada programera i tehnologa, generalni direktor NVIDIA-e Jensen Huang prošetao je binom u svojoj ikoničnoj kožnoj jakni, dramatično zastajući pre nego što je objavio: “Era univerzalne robotike je stigla.” Ta izjava, dostavljena na NVIDIA-inoj GTC 2025 konferenciji u utorak, bila je više od hiperbole—bila je otkrivanje onoga što bi mogao postati Android trenutak za robotiku: NVIDIA Isaac GR00T N1, prvi svetski osnovni model humanoidnog robota otvorenog koda.

Mozak za svako telo: Demokratizacija robotske inteligencije

Stojeći u oštrom kontrastu sa vlasničkim AI sistemima koji dominiraju današnjim naslovima, GR00T N1 predstavlja fundamentalno drugačiji pristup robotskoj inteligenciji—onaj izgrađen na otvorenosti, pristupačnosti i viziji robota koji mogu da generalizuju kroz različita okruženja i zadatke bez specijalizovanog programiranja za svaki scenario.

“Sa NVIDIA Isaac GR00T N1 i novim okvirima za generisanje podataka i učenje robota, programeri robotike širom sveta će otvoriti sledeću granicu u dobu veštačke inteligencije,” rekao je Huang prepunoj areni u svom uvodnom govoru koji je trajao više od dva sata. Ova izjava obuhvata ambicioznu strategiju NVIDIA-e: stvoriti osnovnu inteligenciju koja će pokretati sledeću generaciju humanoidnih robota, a zatim je učiniti besplatno dostupnom programerima širom sveta.

Ono što ovu najavu čini posebno značajnom jeste način na koji ona rešava najuporniji izazov u robotici—skalabilnost podataka za obuku. Kako je Jim Fan, viši menadžer istraživanja u NVIDIA-i i vođa utelovljene veštačke inteligencije, objasnio u LinkedIn objavi nakon prezentacije: “Na misiji smo da demokratizujemo fizičku veštačku inteligenciju. Moć opšteg robotskog mozga, na dlanu vaše ruke—sa samo 2 milijarde parametara, N1 uči iz najraznovrsnijeg skupa podataka o fizičkim akcijama ikada sastavljenog i nadmašuje svoju težinu.”

Robot koji razmišlja brzo i sporo

U srcu GR00T N1 je dualna arhitektura sistema inspirisana ljudskom kognicijom—ono što NVIDIA naziva “brzim i sporim” razmišljanjem. Pristup crpi iz teorija kognitivne nauke koje dele ljudsko razmišljanje na dva sistema: intuitivne, automatske odgovore i promišljeno, metodično rezonovanje.

“Sistem 2”, komponenta sporog razmišljanja, koristi vizuelni jezički model da percipira i razmišlja o okruženju robota i instrukcijama koje prima, a zatim planira odgovarajuće akcije. “Sistem 1”, komponenta brzog razmišljanja, prevodi ove planove u precizne, kontinuirane pokrete robota pri brzini izvršavanja od 120Hz. Ova arhitektura omogućava robotima da upravljaju složenim zadacima koji zahtevaju i promišljanje i tečno kretanje—podizanje predmeta, manipulisanje njima jednom ili obema rukama i izvođenje višestepenih sekvenci.

U demonstraciji koja je vidljivo uzbudila publiku, Huang je pokazao 1X-ovog humanoidnog robota Neo kako autonomno obavlja kućne zadatke pospremanja koristeći politiku izgrađenu na GR00T N1. Fluidni pokreti robota i očigledno razumevanje njegovog okruženja istakli su potencijal modela za praktične primene.

Rušenje barijere podataka sa sintetičkom realnošću

Možda najrevolucionarniji aspekt NVIDIA-inog pristupa je način na koji rešava fundamentalni problem podataka u robotici. Dok jezički modeli mogu da se treniraju na ogromnom korpusu teksta sa interneta, učenje robota je tradicionalno bilo ograničeno fizičkim ograničenjima sveta—ljudski demonstrator može da generiše samo 24 sata podataka za obuku dnevno.

“Podaci ljudskih demonstracija su ograničeni brojem sati u danu,” objasnio je narator u NVIDIA-inom uvodnom videu za GR00T N1. Da bi prevazišla ovo ograničenje, NVIDIA je razvila okvire za eksponencijalno umnožavanje demonstracija iz stvarnog sveta u masivne sintetičke skupove podataka.

Koristeći prve komponente NVIDIA Isaac GR00T Blueprinta, kompanija je generisala 780.000 sintetičkih trajektorija—ekvivalent devet kontinuiranih meseci podataka ljudskih demonstracija—za samo 11 sati. Kada se kombinuju sa stvarnim podacima, ovaj sintetički skup podataka poboljšao je performanse GR00T N1 za 40% u poređenju sa korišćenjem samo stvarnih podataka.

Pristup koristi tri izvora podataka: stvarne podatke teleopreracije humanoidnog robota (prikupljene korišćenjem sistema poput Apple Vision Pro za imerzivnu kontrolu), podatke simulacije velikih razmera (koje NVIDIA čini otvorenim kodom sa preko 300.000 trajektorija) i ono što Fan naziva “neuralnim trajektorijama”—korišćenje najsavremenijih modela za generisanje videa da “haluciniraju” nove sintetičke podatke sa tačnom fizikom.

“Koristeći Jensenove reči, ‘sistematski beskonačni podaci’!” primetio je Fan u svojoj objavi, referirajući se na Huangovu karakterizaciju ovog pristupa generisanju podataka.

Trenutak iz Ratova zvezda: Blue krade šou

U trenutku koji je naterao publiku da posegne za telefonima, Huang je predstavio “Blue”, harizmatičnog robota koji izgleda kao da je iskoračio iz filma Ratovi zvezda. Dvonogi droid, koji podseća na R2-D2 ali sa svojom prepoznatljivom ličnošću, šetao je oko Huanga, izražajno bipovao i klimao glavom na oduševljenje publike.

“Recite mi da to nije bilo neverovatno,” rekao je Huang uz aplauz dok je Blue demonstrirao svoje sposobnosti. Robot nije bio samo za pokazivanje—demonstrirao je novo partnerstvo NVIDIA-e sa Google DeepMind-om i Disney Research-om na izgradnji novog fizičkog pogona otvorenog koda pod nazivom Newton.

“Potreban nam je fizički pogon koji je dizajniran za veoma fine, krute i meke objekte, dizajniran za mogućnost treniranja taktilnih povratnih informacija i finih motoričkih veština i kontrole aktuatora,” objasnio je Huang. Newton pogon, izgrađen na NVIDIA Warp okviru, biće optimizovan za učenje robota i kompatibilan sa simulacijskim okvirima kao što su Google DeepMind-ov MuJoCo i NVIDIA Isaac Lab.

Kyle Laughlin, viši potpredsednik u Walt Disney Imagineering Research & Development, dao je kontekst za Disneyevo uključivanje: “BDX droidi su samo početak. Posvećeni smo tome da oživimo više likova na načine koje svet još nije video, a ova saradnja sa Disney Research-om, NVIDIA-om i Google DeepMind-om je ključni deo te vizije.”

Prilika od 10 biliona dolara

Ulozi u ovoj robotskoj revoluciji su ogromni. Huang je opisao robote kao “sledeću industriju vrednu 10 biliona dolara”, rešavajući globalne nedostatke radne snage procenjene na više od 50 miliona ljudi.

Za kompanije koje razvijaju humanoidne robote, GR00T N1 nudi značajnu prednost. Umesto da grade robotsku inteligenciju od nule, programeri mogu da iskoriste NVIDIA-in osnovni model i prilagode ga za specifične robote ili zadatke kroz post-trening.

Bernt Børnich, generalni direktor 1X Technologies, jednog od ranih partnera koji koriste GR00T N1, naglasio je ovu prednost: “NVIDIA-in model GR00T N1 predstavlja veliki proboj za robotsko rezonovanje i veštine. Sa minimalnom količinom podataka za post-trening, uspeli smo da ga u potpunosti implementiramo na NEO Gamma—unapređujući našu misiju stvaranja robota koji nisu alati, već saputnici koji mogu da pomognu ljudima na značajne, nemerjive načine.”

Drugi vodeći programeri humanoidnih robota sa ranim pristupom uključuju Agility Robotics, Boston Dynamics, Mentee Robotics i NEURA Robotics.

Kros-otelovljenje: Neočekivani obrt

Dok su humanoidni roboti primarni fokus GR00T N1, Fan je otkrio intrigantnu sposobnost: podršku za kros-otelovljenje. “Fino ga podešavamo da radi na robotskoj ruci HuggingFace LeRobot SO100 od 110 dolara!” napisao je. Ovo pokazuje da se prednosti osnovnog modela mogu proširiti izvan skupih humanoidnih platformi na pristupačniji hardver.

Fanovo uzbuđenje zbog ovog razvoja bilo je očigledno u njegovom zaključku: “Otvoreni robotski mozak radi na otvorenom hardveru. Zvuči baš kako treba. Hajde da rešimo robotiku, zajedno, jedan token u isto vreme.”

Put napred

GR00T N1 model, podaci za obuku i scenariji za evaluaciju zadataka sada su dostupni na Hugging Face i GitHub-u, sa NVIDIA Isaac GR00T Blueprint-om za sintetičko generisanje pokreta manipulacije dostupnim kao interaktivna demonstracija na build.nvidia.com.

Za programere koji žele da rade sa ovim modelima, NVIDIA je takođe najavila DGX Spark lični AI superkompjuter, koji pruža gotov sistem za proširenje sposobnosti GR00T N1 za nove robote, zadatke i okruženja bez obimnog prilagođenog programiranja.

Očekuje se da će fizički pogon Newton biti dostupan kasnije ove godine, dodatno proširujući alate za programere robotike.

Demokratizacija fizičke veštačke inteligencije

Ono što razlikuje NVIDIA-in pristup je naglasak na otvorenosti i pristupačnosti. Čineći GR00T N1 i pridružene alate široko dostupnim, NVIDIA se pozicionira ne kao jedini graditelj robotske inteligencije, već kao osnovni sloj na kojem globalna zajednica programera može da inovira.

Kako robotika prelazi sa specijalizovanih industrijskih primena na univerzalne sposobnosti kroz različita okruženja, NVIDIA-in otvoreni pristup mogao bi da ubrza inovacije na načine slične onome kako je softver otvorenog koda transformisao računarstvo. Kompanija koja je izgradila svoju reputaciju na grafičkoj obradi za gejming sada postavlja temelje za budućnost u kojoj su inteligentni roboti sveprisutni kao pametni telefoni danas.

U robotskoj zajednici, reakcije na GR00T N1 su bile entuzijastične, iako postoji određena skepsa u vezi sa trenutnim ograničenjima robotskog hardvera. Kao što je jedan osnivač robotske kompanije primetio u odgovoru na raniju GR00T nadogradnju: “bilo bi u redu da je robotski hardver uporediv sa ljudskim. Što nije. Bolna tačka je da su roboti nezgrapne nespretne aproksimacije i nigde blizu ljudskom ekvivalentu.”

Ipak, NVIDIA-ina vizija je jasna: ako roboti treba da postanu zaista svestrani i korisni u bezbrojnim scenarijima ljudskog života, potrebna im je univerzalna inteligencija koja se može brzo prilagoditi novim okruženjima i zadacima. Sa GR00T N1, ta budućnost upravo je došla značajan korak bliže.

“Era univerzalne robotike je stigla,” izjavio je Huang. Za polje koje je često previše obećavalo a premalo isporučivalo, NVIDIA-in sistematski pristup robotskoj inteligenciji—koji kombinuje osnovne modele, generisanje sintetičkih podataka i otvorenu saradnju—predstavlja možda najkredibilniji put ka ostvarenju te izjave.