Nézzünk szembe vele: az önvezető autók ígérete már évek óta lóg előttünk, mint egy répa a boton. Robot sofőröket, stresszmentes ingázást és azt ígérték, hogy végre befejezhetjük azt a keresztrejtvényt munkába menet. De a valóság kicsit… döcögősebb volt.
Egészen mostanáig, úgy tűnik. Egy új tanulmány nagy port kavart egy meglepően egyszerű megközelítéssel: hagyjuk, hogy az autók egymás ellen játszva tanuljanak vezetni. Igen, jól olvasta. Olyan, mint egy demolition derby, csak algoritmusokkal.
Gigaflow: Ahol az Autók Autósiskolába Járnak (és Káoszt Okoznak)
A titkos összetevő egy “Gigaflow” nevű rendszer, egy batch-feldolgozó szimulátor, amely képes óránként 42 évnyi szubjektív vezetési tapasztalatot szintetizálni és betanítani egyetlen 8-GPU-s csomóponton. Képzeljen el egy digitális Thunderdome-ot, ahol önvezető autók születnek, megkapják az alapvető szabályokat (ne ütközz, érj célba), majd szabadon engedik őket, hogy megküzdjenek egymással a virtuális utakon. Próba-szerencse alapon tanulnak, folyamatosan alkalmazkodva egymás… nevezzük úgy, “egyedi” vezetési stílusához.
Érdekes tény: Mindössze 10 nap alatt ezek az AI autók több mint 1,6 milliárd kilométert
vezettek - ez több mint a Föld és a Szaturnusz közötti távolság! Micsoda egy útikalauz...
Az eredmény? Egy egyedülálló rendszer, amely teljes egészében önálló játék révén tanult, felülmúlja a korábbi csúcsteljesítményeket a CARLA, nuPlan és a Waymo Open Motion Dataset teszteken.
A “Minimalista Jutalmazási Függvény” – Avagy Hogyan Tanítsunk Meg egy Autót Viselkedni (Többé-kevésbé)
Itt jön az igazán érdekes rész. A kutatók nem tömték tele az AI-t terabájtnyi emberi vezetési adattal. Ehelyett egy “minimalista jutalmazási függvényt” használtak. Alapvetően az autók jutalmat kapnak, ha:
- Elérik céljukat
- Elkerülik az ütközéseket
- A sávjukban maradnak
- Nem hajtanak át piros lámpán
- Ésszerű gyorsulást tartanak
Olyan ez, mint egy kölyökkutya képzése. Nem kell neki órákat mutatni jól viselkedő kutyákról készült videókból. Csak jutalmat kap, ha leül, és megszidják, ha megrágja a kedvenc cipőnket.
A Jó, a Rossz és a Kifejezetten Vicces
A jó hír, hogy ez a megközelítés úgy tűnik, működik. Az eredményül kapott rendszer csúcsteljesítményt ér el több autonóm vezetési tesztsorozaton, még a valós emberi adatokon képzett rendszereket is felülmúlva. Az autók meglepően robusztusak is, átlagosan 17,5 év folyamatos vezetés telik el incidensek között szimulációban.
A rossz hír? Nos, ha az autók úgy tanulnak vezetni, mint mi, az azt jelenti, hogy a rossz szokásainkat is elsajátítják. Számíthatunk rá, hogy az önvezető autók bevágnak egymás elé, passzív-agresszív sávváltásokat hajtanak végre, és talán még AI-vezérelt útellenességre is sor kerül.
És ami kifejezetten vicces? Képzeljünk el egy jövőt, ahol az önvezető autókat túlzottan udvariasra programozzák, minden gyalogosnak elsőbbséget adnak, és mindenkit beengednek maguk elé. A forgalom teljesen leállna, ahogy ezek a hiper-udvarias autók végtelen “ön után, nem, ön után” körökbe kerülnének.
A Jövő (Remélhetőleg) Kevésbé Döcögős
Természetesen még hosszú út áll előttünk. Ahogy maguk a kutatók is rámutatnak, az AI által a tesztelés során elszenvedett szabálysértések többsége maguknak a tesztrendszereknek a korlátaiból adódott, például amikor gyalogosok körültekintés nélkül rohantak az úttestre. De az a tény, hogy az önvezető autók képesek megtanulni navigálni komplex, kiszámíthatatlan környezetekben önálló gyakorlás révén, jelentős előrelépés.
Szóval, amikor legközelebb önvezető autót lát az úton, gondoljon arra, hogy valószínűleg több szimulált dugón és majdnem-baleseten van túl, mint amennyit Ön egész életében tapasztalt. És ha bevág Ön elé, csak emlékezzen: valószínűleg a legjobbtól (vagy legrosszabbtól) tanul.
Szerkesztői megjegyzés: Egyetlen valódi autó sem sérült meg az AI rendszer
készítése során. Bár néhány virtuális autónak határozottan nehéz napja volt.