Auto a Guida Autonoma: Finalmente Stanno Imparando a Guidare Come Noi (ed È un Po' Inquietante)

Amici, diciamocelo: la promessa delle auto a guida autonoma ci è stata sbandierata davanti come una carota per anni. Ci hanno promesso autisti robot, viaggi senza stress e la possibilità di finalmente completare quel cruciverba durante il tragitto verso il lavoro. Ma la realtà è stata un po’… accidentata.

Fino ad ora, pare. Un nuovo studio sta facendo scalpore con un approccio sorprendentemente semplice: lasciare che le auto imparino a guidare sfidandosi a vicenda. Sì, avete letto bene. È come un derby di demolizione, ma con gli algoritmi.

Gigaflow: Dove le Auto Vanno a Scuola Guida (e Creano il Caos)

Il segreto sta in un sistema chiamato “Gigaflow”, un simulatore in batch capace di sintetizzare e addestrare su 42 anni di esperienza di guida soggettiva all’ora su un singolo nodo a 8 GPU. Immaginate una Thunderdome digitale dove le auto a guida autonoma vengono generate, ricevono un set base di regole (non schiantarsi, raggiungere la destinazione), e vengono poi lasciate libere di sfidarsi su strade virtuali. Imparano per tentativi ed errori, adattandosi costantemente agli… chiamiamoli “peculiari” stili di guida degli altri.

Curiosità: In soli 10 giorni di addestramento, queste auto AI hanno percorso oltre 1,6 miliardi 
di chilometri - più della distanza dalla Terra a Saturno! Parliamo di un bel viaggio...

Il risultato? Una singola policy addestrata interamente tramite auto-apprendimento supera le precedenti prestazioni allo stato dell’arte su CARLA, nuPlan e il Waymo Open Motion Dataset.

La “Funzione di Ricompensa Minimalista” – O, Come Insegnare a un’Auto a Comportarsi (Più o Meno)

Ecco la parte davvero interessante. I ricercatori non hanno imboccato l’IA con terabyte di dati sulla guida umana. Invece, hanno usato una “funzione di ricompensa minimalista”. In pratica, le auto vengono premiate per:

  • Raggiungere la destinazione
  • Evitare collisioni
  • Rimanere nella propria corsia
  • Non passare col rosso
  • Mantenere un’accelerazione ragionevole

È come addestrare un cucciolo. Non serve mostrargli ore di video di cani ben educati. Basta dargli un premio quando si siede e rimproverarlo quando mastica le tue scarpe preferite.

Il Buono, il Cattivo e il Decisamente Esilarante

La buona notizia è che questo approccio sembra funzionare. La policy risultante raggiunge prestazioni allo stato dell’arte su molteplici benchmark di guida autonoma, superando persino i sistemi addestrati su dati umani reali. Le auto sono anche sorprendentemente robuste, con una media di 17,5 anni di guida continua tra un incidente e l’altro in simulazione.

La cattiva notizia? Beh, se le auto stanno imparando a guidare come noi, significa che stanno anche imparando le nostre cattive abitudini. Aspettatevi di vedere auto a guida autonoma che si tagliano la strada a vicenda, si inseriscono in modo passivo-aggressivo e forse anche qualche occasionale episodio di rabbia stradale alimentata dall’IA.

E il decisamente esilarante? Immaginate un futuro dove le auto a guida autonoma sono programmate per essere eccessivamente educate, cedendo il passo a ogni pedone e lasciando che tutti si inseriscano davanti a loro. Il traffico si paralizzerebbe mentre queste auto iper-cortesi si impegnano in infiniti cicli di “dopo di lei, no, dopo di lei.”

Il Futuro è (Si Spera) Meno Accidentato

Ovviamente, c’è ancora molta strada da fare. Come sottolineano gli stessi ricercatori, molte delle infrazioni commesse dall’IA durante i test erano dovute a limitazioni dei benchmark stessi, come pedoni che si lanciano nel traffico senza guardare. Ma il fatto che le auto a guida autonoma possano imparare a navigare in ambienti complessi e imprevedibili attraverso l’auto-apprendimento è un importante passo avanti.

Quindi, la prossima volta che vedete un’auto a guida autonoma sulla strada, ricordate che probabilmente ha attraversato più ingorghi simulati e quasi-incidenti di quanti ne abbiate vissuti voi in tutta la vita. E se vi taglia la strada, ricordate: sta probabilmente imparando dai migliori (o dai peggiori) di noi.

Nota della Redazione: Nessuna auto reale è stata danneggiata durante la creazione di questo 
sistema di IA. Anche se alcune auto virtuali hanno sicuramente avuto una brutta giornata in ufficio.

Fonte: Robust Autonomy Emerges from Self-Play