Navigáció

Robotska revolucija je otvorenog koda: NVIDIA-in GR00T N1 najavljuje eru višenamjenske robotike

Robotska revolucija je otvorenog koda: NVIDIA-in GR00T N1 uvodi doba generalističke robotike

U prostranom SAP Centru u San Joseu, usred električnog iščekivanja tisuća developera i tehnoloških stručnjaka, izvršni direktor NVIDIA-e Jensen Huang koračao je pozornicom u svojoj ikoničnoj kožnoj jakni, dramatično zastajući prije nego što je objavio: “Doba generalističke robotike je stiglo.” Ta izjava, predstavljena na NVIDIA-inoj GTC 2025 konferenciji u utorak, bila je više od hiperbole—predstavljala je otkrivanje onoga što bi mogao biti Android trenutak za robotiku: NVIDIA Isaac GR00T N1, prvi svjetski temeljni model humanoidnog robota otvorenog koda.

Mozak za svako tijelo: Demokratizacija robotske inteligencije

U oštrom kontrastu s vlasničkim AI sustavima koji dominiraju današnjim naslovima, GR00T N1 predstavlja fundamentalno drugačiji pristup robotskoj inteligenciji—onaj izgrađen na otvorenosti, pristupačnosti i viziji robota koji se mogu prilagoditi različitim okruženjima i zadacima bez specijaliziranog programiranja za svaki scenarij.

“S NVIDIA Isaac GR00T N1 i novim okvirima za generiranje podataka i učenje robota, razvojni inženjeri robotike diljem svijeta otvorit će novu granicu u doba umjetne inteligencije,” rekao je Huang prepunoj areni u svom uvodnom govoru koji je trajao više od dva sata. Ova izjava obuhvaća NVIDIA-inu ambicioznu strategiju: stvoriti temeljnu inteligenciju koja će pokretati sljedeću generaciju humanoidnih robota, a zatim je besplatno učiniti dostupnom razvojnim inženjerima diljem svijeta.

Ono što ovu objavu čini posebno značajnom jest način na koji rješava najuporniji izazov u robotici—skalabilnost podataka za trening. Kao što je Jim Fan, NVIDIA-in viši istraživački menadžer i voditelj utjelovljene AI, objasnio u LinkedIn objavi nakon uvodnog govora: “Na misiji smo demokratizacije fizičke umjetne inteligencije. Snaga općeg robotskog mozga, na dlanu vaše ruke—s samo 2 milijarde parametara, N1 uči iz najraznolikijeg skupa podataka o fizičkim akcijama ikad sastavljenog i nadmašuje svoju težinu.”

Robot koji razmišlja brzo i sporo

U srcu GR00T N1 je dvojna arhitektura sustava inspirirana ljudskom kognicijom—ono što NVIDIA naziva “brzim i sporim” razmišljanjem. Pristup se temelji na teorijama kognitivne znanosti koje ljudsko razmišljanje dijele na dva sustava: intuitivne, automatske odgovore i promišljeno, metodično rasuđivanje.

“Sustav 2”, komponenta sporog razmišljanja, koristi vizualni jezični model za percepciju i razumijevanje robotovog okruženja i uputa koje prima, a zatim planira odgovarajuće akcije. “Sustav 1”, komponenta brzog razmišljanja, prevodi te planove u precizne, kontinuirane robotske pokrete pri brzini izvršavanja od 120Hz. Ova arhitektura omogućuje robotima da se nose sa složenim zadacima koji zahtijevaju i promišljanje i fluidno kretanje—podizanje predmeta, manipuliranje jednom ili objema rukama i izvođenje višestranih sekvenci.

U demonstraciji koja je vidljivo uzbudila publiku, Huang je pokazao humanoidnog robota Neo tvrtke 1X koji samostalno obavlja kućanske zadatke pospremanja koristeći politiku izgrađenu na GR00T N1. Fluidni pokreti robota i očito razumijevanje okoline istaknuli su potencijal modela za praktične primjene.

Razbijanje barijere podataka sa sintetičkom stvarnošću

Možda je najrevolucionarniji aspekt NVIDIA-inog pristupa način na koji rješava temeljni problem podataka u robotici. Dok se jezični modeli mogu trenirati na ogromnom korpusu teksta s interneta, učenje robota tradicionalno je bilo ograničeno fizičkim ograničenjima svijeta—ljudski demonstrator može generirati samo 24 sata podataka za trening dnevno.

“Podaci demonstracija ljudi ograničeni su brojem sati u danu,” objasnio je narator u NVIDIA-inom uvodnom videu za GR00T N1. Za prevladavanje ovog ograničenja, NVIDIA je razvila okvire za eksponencijalno množenje demonstracija iz stvarnog svijeta u masivne sintetičke skupove podataka.

Koristeći prve komponente NVIDIA Isaac GR00T Blueprinta, tvrtka je generirala 780.000 sintetičkih trajektorija—ekvivalent devet kontinuiranih mjeseci ljudskih demonstracija—u samo 11 sati. Kada je kombiniran sa stvarnim podacima, ovaj sintetički skup podataka poboljšao je performanse GR00T N1 za 40% u usporedbi s korištenjem samo stvarnih podataka.

Pristup koristi tri izvora podataka: stvarne podatke teleoperacije humanoidnih robota (prikupljene pomoću sustava poput Apple Vision Pro za imerzivnu kontrolu), podatke iz simulacija velikih razmjera (koje NVIDIA čini otvorenog koda s više od 300.000 trajektorija) i ono što Fan naziva “neuralnim trajektorijama”—korištenje najmodernijih modela za generiranje videa za “haluciniranje” novih sintetičkih podataka s točnom fizikom.

“Koristeći Jensenove riječi, ‘sistematski beskonačni podaci’!” primijetio je Fan u svojoj objavi, referirajući se na Huangovu karakterizaciju ovog pristupa generiranju podataka.

Star Wars trenutak: Blue krade pozornicu

U trenutku koji je naveo publiku da posegne za svojim telefonima, Huang je predstavio “Blue”, karizmatičnog robota koji izgleda kao da je izašao iz filma Ratovi zvijezda. Dvonožni droid, koji podsjeća na R2-D2, ali s vlastitom prepoznatljivom osobnošću, hodao je oko Huanga, izražajno bipkao i kimao glavom na oduševljenje publike.

“Recite mi da to nije bilo nevjerojatno,” rekao je Huang uz pljesak dok je Blue demonstrirao svoje sposobnosti. Robot nije bio samo za pokazivanje—demonstrirao je NVIDIA-ino novo partnerstvo s Google DeepMindom i Disney Researchom za izgradnju novog fizičkog enginea otvorenog koda nazvanog Newton.

“Trebamo fizički engine koji je dizajniran za vrlo fine, krute i meke objekte, dizajniran za mogućnost treniranja taktilnih povratnih informacija, finih motoričkih vještina i kontrole aktuatora,” objasnio je Huang. Engine Newton, izgrađen na NVIDIA Warp okviru, bit će optimiziran za učenje robota i kompatibilan sa simulacijskim okvirima kao što su Google DeepMindov MuJoCo i NVIDIA Isaac Lab.

Kyle Laughlin, stariji potpredsjednik Walt Disney Imagineering Research & Developmenta, dao je kontekst za Disneyjevu uključenost: “BDX droidi su tek početak. Posvećeni smo oživljavanju više likova na načine koje svijet još nije vidio, a ova suradnja s Disney Researchom, NVIDIA-om i Google DeepMindom ključni je dio te vizije.”

Prilika od 10 bilijuna dolara

Ulozi u ovoj robotskoj revoluciji su ogromni. Huang je opisao robote kao “sljedeću industriju vrijednu 10 bilijuna dolara”, rješavajući globalne nedostatke radne snage procijenjene na više od 50 milijuna ljudi.

Za tvrtke koje razvijaju humanoidne robote, GR00T N1 nudi značajnu prednost. Umjesto izgradnje robotske inteligencije od nule, developeri mogu iskoristiti NVIDIA-in temeljni model i prilagoditi ga specifičnim robotima ili zadacima kroz post-trening.

Bernt Børnich, izvršni direktor 1X Technologies, jednog od ranih partnera koji koriste GR00T N1, naglasio je ovu prednost: “NVIDIA-in model GR00T N1 predstavlja veliki proboj za robotsko rasuđivanje i vještine. S minimalnom količinom podataka za post-trening, uspjeli smo potpuno implementirati na NEO Gamma—unapređujući našu misiju stvaranja robota koji nisu alati, već suputnici koji mogu pomoći ljudima na smislene, nemjerljive načine.”

Drugi vodeći razvijatelji humanoidnih robota s ranim pristupom uključuju Agility Robotics, Boston Dynamics, Mentee Robotics i NEURA Robotics.

Cross-embodiment: Neočekivani obrat

Iako su humanoidni roboti primarni fokus GR00T N1, Fan je otkrio intrigantnu sposobnost: podršku za različita utjelovljenja. “Doradili smo ga da radi na $110 HuggingFace LeRobot SO100 robotskoj ruci!” napisao je. To pokazuje da se koristi temeljnog modela mogu proširiti izvan skupih humanoidnih platformi na pristupačniji hardver.

Fanova uzbuđenost zbog ovog razvoja bila je očita u njegovom zaključku: “Otvoreni robotski mozak radi na otvorenom hardveru. Zvuči upravo kako treba. Riješimo robotiku, zajedno, jedan token po jedan.”

Put naprijed

Model GR00T N1, podaci za trening i scenariji evaluacije zadataka sada su dostupni na Hugging Face i GitHubu, s NVIDIA Isaac GR00T Blueprintom za sintetičko generiranje manipulacijskih pokreta dostupnim kao interaktivni demo na build.nvidia.com.

Za developere koji žele raditi s ovim modelima, NVIDIA je također najavila DGX Spark osobno AI superračunalo, pružajući gotov sustav za proširenje mogućnosti GR00T N1 za nove robote, zadatke i okruženja bez opsežnog prilagođenog programiranja.

Očekuje se da će Newton fizički engine biti dostupan kasnije ove godine, dodatno proširujući set alata za razvijatelje robotike.

Demokratizacija fizičke umjetne inteligencije

Ono što razlikuje NVIDIA-in pristup je naglasak na otvorenosti i pristupačnosti. Čineći GR00T N1 i povezane alate široko dostupnima, NVIDIA se pozicionira ne kao jedini graditelj robotske inteligencije, već kao temeljni sloj na kojem globalna zajednica developera može inovirati.

Dok robotika prelazi iz specijaliziranih industrijskih primjena u generalističke sposobnosti u različitim okruženjima, NVIDIA-in otvoreni pristup mogao bi ubrzati inovacije na način sličan onome kako je softver otvorenog koda transformirao računarstvo. Tvrtka koja je izgradila svoju reputaciju na grafičkoj obradi za igre sada postavlja temelje za budućnost u kojoj su inteligentni roboti jednako sveprisutni kao što su danas pametni telefoni.

U robotskoj zajednici, reakcije na GR00T N1 bile su entuzijastične, iako ostaje određeni skepticizam o trenutnim ograničenjima robotskog hardvera. Kao što je jedan osnivač robotske tvrtke primijetio kao odgovor na ranije ažuriranje GR00T-a: “bilo bi u redu kad bi robotski hardver bio usporediv s ljudskim. Što nije. Bolna točka je da su roboti nespretne, nezgrapne aproksimacije i nigdje blizu ljudskom ekvivalentu.”

Ipak, NVIDIA-ina vizija je jasna: ako roboti trebaju postati istinski svestrani i korisni u bezbrojnim scenarijima ljudskog života, trebaju generalističku inteligenciju koja se može brzo prilagoditi novim okruženjima i zadacima. S GR00T N1, ta budućnost je upravo napravila značajan korak bliže.

“Doba generalističke robotike je ovdje,” izjavio je Huang. Za područje koje je često previše obećavalo, a premalo isporučivalo, NVIDIA-in sistematični pristup robotskoj inteligenciji—koji kombinira temeljne modele, generiranje sintetičkih podataka i otvorenu suradnju—predstavlja možda najvjerodostojniji put prema ostvarenju te izjave.