I finanziamenti dei venture capital scorrono a fiumi, le demo su YouTube accumulano milioni di visualizzazioni e le promesse si fanno più audaci a ogni trimestre. Dopo aver visto i grandi modelli linguistici come ChatGPT di OpenAI conquistare il mondo digitale apparentemente da un giorno all’altro, tutti si pongono la stessa domanda da miliardi di dollari: quando arriverà il “momento ChatGPT” per la robotica?
Secondo due veterani che hanno vissuto in prima linea l’evoluzione della “embodied AI” (l’intelligenza artificiale incarnata), la risposta è spiazzante: non arriverà mai. E fareste bene a dar loro retta. Jonathan W. Hurst, co-fondatore di Agility Robotics (i creatori del robot umanoide Digit), e Hans Peter Brøndmo, che ha guidato il progetto “moonshot” Everyday Robots presso Google X, hanno appena pubblicato un bagno di realtà quanto mai necessario. Sono qui per gettare un secchio d’acqua gelida — di quella di grado industriale — sul treno dell’hype, sostenendo che non esiste una singola, magica scoperta nell’IA capace di risolvere tutto d’un colpo. La strada verso un mondo popolato da robot utili è lastricata di un lavoro ingegneristico estenuante, incrementale e decisamente poco glamour.
Con i finanziamenti per la robotica che hanno toccato i 6,1 miliardi di dollari nel 2024, in crescita rispetto ai 5,1 miliardi del 2023, la posta in gioco è astronomica. Ma, come argomentano Hurst e Brøndmo, il divario tra una demo appariscente e un robot commercialmente valido, sicuro e affidabile rimane un abisso.
La grande illusione: decostruire la demo di YouTube
Li abbiamo visti tutti. Quei video di robot umanoidi che eseguono salti mortali impeccabili, ballano in sincronia o si cimentano in coreografie di arti marziali millimetriche. L’ultima sensazione virale ha mostrato gli umanoidi di Unitree Robotics in una performance di kung fu durante il Gala della Festa di Primavera 2026 in Cina: un’esibizione di coordinazione impressionante a pochi centimetri da piccoli performer in carne e ossa.

Hurst e Brøndmo non esitano a sottolineare ciò che gli addetti ai lavori sanno da anni: “mai fidarsi di un video di robot su YouTube”. Queste performance, per quanto tecnicamente sbalorditive, sono l’equivalente robotico di uno spettacolo di Broadway meticolosamente pianificato. Dimostrano un controllo motorio di basso livello e una coreografia straordinaria, ma il loro livello di autonomia è più vicino a quello di un robot da catena di montaggio che a quello di una macchina pensante. Il mondo reale — caotico, imprevedibile e ostinatamente privo di copione — è una bestia completamente diversa. È il classico caso del paradosso di Moravec: compiti banali per un essere umano, come muoversi in una stanza disordinata, sono monumentali per un robot, mentre calcoli complessi risultano semplicissimi.
I dati: una sfida titanica e ancora irrisolta
Gli LLM hanno avuto un vantaggio enorme: sono stati addestrati su Internet, un database colossale di testi e immagini generati dagli umani. I robot non hanno questo lusso. Per imparare, un robot ha bisogno di dati dal mondo fisico, uno spazio ad altissima dimensionalità dove le variabili includono ogni cosa: dagli angoli delle articolazioni ai feedback di forza, dalle condizioni di luce ai movimenti imprevedibili delle persone.
La portata di questa sfida è vertiginosa. Presso Everyday Robots, il team di Brøndmo ha fatto girare 240 milioni di istanze robotiche simulate nel 2022 solo per addestrare un modello a smistare i rifiuti con una competenza accettabile. E si trattava di un singolo set di abilità relativamente semplice. Ora, moltiplicate quello sforzo per il numero quasi infinito di compiti che ci aspettiamo da un robot general-purpose. È un problema di raccolta dati di un ordine di grandezza completamente diverso, che rimane in gran parte irrisolto. Il progetto stesso è stato infine chiuso all’inizio del 2023 nell’ambito di una più ampia operazione di riduzione dei costi della casa madre Alphabet.
Non esisterà una singola “IA per robot”
L’idea di un unico, monolitico modello di IA in grado di pilotare qualsiasi robot — su ruote, con le gambe, volante o sottomarino — è pura fantascienza. Le realtà fisiche delle diverse forme (embodiments) e degli ambienti sono troppo vaste. Gli autori sostengono che l’architettura vincente sarà quella che chiamano “IA agentica”. Si tratta di modelli di coordinamento di alto livello capaci di ragionare, pianificare e delegare compiti a una suite di strumenti IA più piccoli e specializzati. Un modello potrebbe gestire la locomozione bipede, un altro la manipolazione fine, e un terzo potrebbe essere dedicato all’interazione sicura uomo-robot.
Questo approccio modulare, sostengono, porterà a una “esplosione cambriana” di macchine utili e intelligenti. Non sarà un singolo Big Bang, ma una fioritura di capacità diverse e specializzate che, se orchestrate correttamente, creeranno una macchina veramente competente.
L’hardware è ancora un osso durissimo
Nonostante tutta l’attenzione rivolta all’IA, un robot rimane un oggetto fisico. E l’hardware, in particolare le parti che gli permettono di interagire con il mondo, resta il principale collo di bottiglia. La maggior parte dei robot industriali utilizza attuatori rigidi e potenti, fantastici per la precisione in un’area recintata ma disastrosi in un ambiente umano. Una semplice collisione accidentale potrebbe essere catastrofica.
Gli esseri umani, al contrario, sono “compliant” (cedevoli). Usiamo costantemente il tatto e il feedback di forza, che si tratti di armeggiare con una chiave in una serratura o di appoggiarci a un bancone. Affinché i robot possano raggiungere questo livello, hanno bisogno di una nuova classe di attuatori sensibili, elastici e consapevoli della forza esercitata. Sebbene esistano già nei laboratori, non sono ancora disponibili su scala, costi o affidabilità necessari per una diffusione di massa. L’IA più brillante del mondo è inutile se il suo corpo è un fardello goffo e pericoloso.
Il vero valore sta nel risolvere i problemi “facili”
L’ultima, e forse più importante, verità è che il valore nel mondo reale non deriva dai salti mortali. Deriva dall’eseguire in modo affidabile i lavori banali, ripetitivi e spesso fisicamente logoranti che gli esseri umani non vogliono più fare. È qui che il gioco si fa duro, o in questo caso, dove i piedi del robot toccano il pavimento del magazzino.
Entrambi gli autori parlano per esperienza. Quando Agility Robotics ha iniziato a distribuire Digit presso i clienti con partner come GXO Logistics, si sono resi conto subito che il primo grande ostacolo non era l’esecuzione del compito, ma la sicurezza. Ciò ha portato a uno sforzo ingegneristico pluriennale per riprogettare il robot per operare in sicurezza negli spazi umani. Allo stesso modo, il team di Everyday Robots presso Google ha imparato sulla propria pelle quanto sia sporco e difficile per un robot pulire i tavoli in un ambiente apparentemente semplice come la mensa di un ufficio.

Questa esperienza sul campo è l’unica via percorribile. È ciò che modella l’architettura dell’IA, evidenzia le carenze dell’hardware e ancora le ambiziose roadmap alla dura realtà delle esigenze dei clienti. Il futuro della robotica sta arrivando, ma arriverà un passo deliberato e ben progettato alla volta.
