Navigáció

La Rivoluzione Robotica è Open Source: GR00T N1 di NVIDIA Inaugura l'Era della Robotica Generalista

La Rivoluzione dei Robot è Open Source: NVIDIA GR00T N1 Inaugura l’Era della Robotica Generalista

Nel cavernoso SAP Center di San Jose, tra l’elettrica anticipazione di migliaia di sviluppatori e tecnologi, il CEO di NVIDIA Jensen Huang ha attraversato il palco nella sua iconica giacca di pelle, fermandosi drammaticamente prima di dichiarare: “L’era della robotica generalista è qui”. Quell’annuncio, rilasciato alla conferenza NVIDIA GTC 2025 di martedì, era più di un’iperbole—era lo svelamento di quello che potrebbe diventare il momento Android per la robotica: NVIDIA Isaac GR00T N1, il primo modello fondazionale open source al mondo per robot umanoidi.

Un Cervello per Ogni Corpo: La Democratizzazione dell’Intelligenza Robotica

In netto contrasto con i sistemi AI proprietari che dominano i titoli di oggi, GR00T N1 rappresenta un approccio fondamentalmente diverso all’intelligenza robotica—uno costruito su apertura, accessibilità e una visione di robot che possono generalizzare attraverso ambienti e compiti senza programmazione specializzata per ogni scenario.

“Con NVIDIA Isaac GR00T N1 e i nuovi framework per la generazione di dati e l’apprendimento robotico, gli sviluppatori di robotica di tutto il mondo apriranno la prossima frontiera nell’era dell’AI”, ha detto Huang all’arena gremita nel suo keynote durato oltre due ore. L’affermazione sintetizza la strategia ambiziosa di NVIDIA: creare l’intelligenza sottostante che alimenterà la prossima generazione di robot umanoidi, per poi renderla liberamente disponibile agli sviluppatori di tutto il mondo.

Ciò che rende questo annuncio particolarmente significativo è come affronta la sfida più persistente nella robotica—la scalabilità dei dati di addestramento. Come ha spiegato Jim Fan, Senior Research Manager di NVIDIA e Lead dell’Embodied AI, in un post su LinkedIn dopo il keynote: “Siamo in missione per democratizzare l’AI Fisica. La potenza di un cervello robotico generale, nel palmo della mano—con soli 2 miliardi di parametri, N1 impara dal set di dati di azioni fisiche più diversificato mai compilato e supera le aspettative”.

Il Robot che Pensa Veloce e Lento

Al cuore di GR00T N1 c’è un’architettura a doppio sistema ispirata alla cognizione umana—quello che NVIDIA chiama pensiero “veloce e lento”. L’approccio attinge dalle teorie delle scienze cognitive che separano il pensiero umano in due sistemi: risposte intuitive, automatiche e ragionamento deliberato, metodico.

Il “Sistema 2”, la componente del pensiero lento, utilizza un modello di visione e linguaggio per percepire e ragionare sull’ambiente del robot e sulle istruzioni che riceve, poi pianifica azioni appropriate. Il “Sistema 1”, la componente del pensiero veloce, traduce questi piani in movimenti robotici precisi e continui a frequenze di esecuzione di 120Hz. Questa architettura consente ai robot di gestire compiti complessi che richiedono sia deliberazione che movimento fluido—afferrare oggetti, manipolarli con uno o entrambe le braccia ed eseguire sequenze multi-fase.

In una dimostrazione che ha visibilmente entusiasmato il pubblico, Huang ha mostrato il robot umanoide Neo di 1X che eseguiva autonomamente compiti domestici di riordino utilizzando una policy costruita su GR00T N1. I movimenti fluidi del robot e l’apparente comprensione del suo ambiente hanno evidenziato il potenziale del modello per applicazioni pratiche.

Superare la Barriera dei Dati con la Realtà Sintetica

Forse l’aspetto più rivoluzionario dell’approccio di NVIDIA è come risolve il problema fondamentale dei dati nella robotica. Mentre i modelli linguistici possono addestrarsi sul vasto corpus testuale di internet, l’apprendimento robotico è stato tradizionalmente limitato dai vincoli del mondo fisico—un dimostratore umano può generare solo 24 ore di dati di addestramento al giorno.

“I dati di dimostrazione umana sono limitati dal numero di ore in un giorno”, ha spiegato il narratore nel video di presentazione di NVIDIA GR00T N1. Per superare questo vincolo, NVIDIA ha sviluppato framework per moltiplicare esponenzialmente le dimostrazioni del mondo reale in massicci dataset sintetici.

Utilizzando i primi componenti del NVIDIA Isaac GR00T Blueprint, l’azienda ha generato 780.000 traiettorie sintetiche—equivalenti a nove mesi continui di dati di dimostrazione umana—in sole 11 ore. Quando combinato con dati reali, questo dataset sintetico ha migliorato le prestazioni di GR00T N1 del 40% rispetto all’utilizzo dei soli dati reali.

L’approccio utilizza tre fonti di dati: dati reali di teleoperazione umanoide (raccolti utilizzando sistemi come Apple Vision Pro per il controllo immersivo), dati di simulazione su larga scala (che NVIDIA sta rilasciando come open source con oltre 300.000 traiettorie) e quelle che Fan chiama “traiettorie neurali”—utilizzando modelli di generazione video all’avanguardia per “allucinare” nuovi dati sintetici con fisica accurata.

“Usando le parole di Jensen, ‘dati sistematicamente infiniti’!” ha osservato Fan nel suo post, riferendosi alla caratterizzazione di Huang di questo approccio alla generazione di dati.

Il Momento Star Wars: Blue Ruba la Scena

In un momento che ha fatto cercare i telefoni al pubblico, Huang ha presentato “Blue”, un robot carismatico che sembra uscito da un film di Star Wars. Il droide a due gambe, che ricorda R2-D2 ma con una propria personalità distinta, ha camminato attorno a Huang, ha emesso suoni espressivi e ha annuito con la testa per la gioia del pubblico.

“Ditemi che non è stato incredibile”, ha detto Huang tra gli applausi mentre Blue dimostrava le sue capacità. Il robot non era solo per show—ha dimostrato la nuova partnership di NVIDIA con Google DeepMind e Disney Research per costruire un nuovo motore fisico open source chiamato Newton.

“Abbiamo bisogno di un motore fisico progettato per corpi rigidi e morbidi a grana finissima, progettato per poter addestrare feedback tattile e abilità motorie fini e controlli degli attuatori”, ha spiegato Huang. Il motore Newton, costruito sul framework NVIDIA Warp, sarà ottimizzato per l’apprendimento robotico e compatibile con framework di simulazione come MuJoCo di Google DeepMind e NVIDIA Isaac Lab.

Kyle Laughlin, vicepresidente senior di Walt Disney Imagineering Research & Development, ha fornito il contesto per il coinvolgimento di Disney: “I droidi BDX sono solo l’inizio. Siamo impegnati a dar vita a più personaggi in modi che il mondo non ha mai visto prima, e questa collaborazione con Disney Research, NVIDIA e Google DeepMind è una parte chiave di quella visione”.

L’Opportunità da 10 Trilioni di Dollari

La posta in gioco in questa rivoluzione robotica è enorme. Huang ha descritto i robot come “la prossima industria da 10 trilioni di dollari”, affrontando carenze di manodopera globali stimate in più di 50 milioni di persone.

Per le aziende che sviluppano robot umanoidi, GR00T N1 offre un vantaggio sostanziale. Anziché costruire l’intelligenza robotica da zero, gli sviluppatori possono sfruttare il modello fondazionale di NVIDIA e personalizzarlo per robot o compiti specifici attraverso il post-addestramento.

Bernt Børnich, CEO di 1X Technologies, uno dei primi partner a utilizzare GR00T N1, ha sottolineato questo vantaggio: “Il modello GR00T N1 di NVIDIA rappresenta una svolta importante per il ragionamento e le abilità robotiche. Con una quantità minima di dati di post-addestramento, siamo stati in grado di implementarlo completamente su NEO Gamma—portando avanti la nostra missione di creare robot che non sono strumenti, ma compagni che possono assistere gli umani in modi significativi e incommensurabili”.

Altri importanti sviluppatori di umanoidi con accesso anticipato includono Agility Robotics, Boston Dynamics, Mentee Robotics e NEURA Robotics.

Cross-Embodiment: La Svolta Inaspettata

Mentre i robot umanoidi sono il focus principale di GR00T N1, Fan ha rivelato una capacità intrigante: il supporto cross-embodiment. “Lo mettiamo a punto per funzionare sul braccio robotico HuggingFace LeRobot SO100 da 110 dollari!” ha scritto. Questo dimostra che i benefici del modello fondazionale possono estendersi oltre le costose piattaforme umanoidi verso hardware più accessibile.

L’entusiasmo di Fan per questo sviluppo era evidente nella sua conclusione: “Il cervello robotico aperto funziona su hardware aperto. Suona perfetto. Risolviamo la robotica, insieme, un token alla volta”.

La Strada Davanti

Il modello GR00T N1, i dati di addestramento e gli scenari di valutazione dei compiti sono ora disponibili su Hugging Face e GitHub, con il NVIDIA Isaac GR00T Blueprint per la generazione sintetica di movimenti di manipolazione disponibile come demo interattiva su build.nvidia.com.

Per gli sviluppatori che desiderano lavorare con questi modelli, NVIDIA ha anche annunciato il supercomputer AI personale DGX Spark, fornendo un sistema chiavi in mano per espandere le capacità di GR00T N1 per nuovi robot, compiti e ambienti senza estesa programmazione personalizzata.

Il motore fisico Newton dovrebbe essere disponibile entro la fine dell’anno, espandendo ulteriormente il set di strumenti per gli sviluppatori di robotica.

La Democratizzazione dell’AI Fisica

Ciò che distingue l’approccio di NVIDIA è la sua enfasi sull’apertura e l’accessibilità. Rendendo GR00T N1 e i suoi strumenti associati ampiamente disponibili, NVIDIA si sta posizionando non come l’unico costruttore di intelligenza robotica, ma come lo strato fondamentale su cui una comunità globale di sviluppatori può innovare.

Mentre la robotica passa da applicazioni industriali specializzate a capacità generaliste attraverso ambienti diversi, l’approccio aperto di NVIDIA potrebbe accelerare l’innovazione in modi simili a come il software open-source ha trasformato l’informatica. L’azienda che ha costruito la sua reputazione sull’elaborazione grafica per il gaming sta ora gettando le basi per un futuro in cui i robot intelligenti sono ubiqui come gli smartphone oggi.

Nella comunità robotica, le reazioni a GR00T N1 sono state entusiastiche, sebbene rimanga un certo scetticismo sugli attuali limiti dell’hardware robotico. Come ha osservato un fondatore di un’azienda robotica in risposta a un precedente aggiornamento di GR00T, “andrebbe bene se l’hardware robotico fosse paragonabile a quello umano. Ma non lo è. Il punto dolente è che i robot sono approssimazioni goffe e maldestre e per nulla equivalenti all’umano”.

Tuttavia, la visione di NVIDIA è chiara: se i robot devono diventare veramente versatili e utili nei numerosi scenari della vita umana, hanno bisogno di un’intelligenza generalista che possa adattarsi rapidamente a nuovi ambienti e compiti. Con GR00T N1, quel futuro è appena diventato un passo significativo più vicino.

“L’era della robotica generalista è qui”, ha dichiarato Huang. Per un campo che ha spesso promesso troppo e mantenuto poco, l’approccio sistematico di NVIDIA all’intelligenza robotica—combinando modelli fondazionali, generazione di dati sintetici e collaborazione aperta—rappresenta forse il percorso più credibile finora verso la realizzazione di quella dichiarazione.