A jövő már itt van: önvezető autók, amelyek egymással versenyezve tanulnak
Cím: Önvezető autók: A káosz iskolája (és a jövő receptje) Leírás: Elfelejthetjük a valós adatok hegyeit. A legújabb kutatás szerint az önvezető rendszerek úgy tanulnak meg vezetni, hogy egymás ellen versenyeznek a szimulációban. Humorral és némi pánikkal.
Nos, emberek, nézzük szembe a ténnyel: az önvezető autók ígérete évek óta lóg előttünk, mint egy cukorka egy bot végén. Robot sofőröket, stresszmentes ingázást és azt az áldott pillanatot ígértek, amikor végre befejezhetjük a keresztrejtvényt a munkahelyre tartva. De a valóság kissé… rögösnek bizonyult.
Eddig. Úgy tűnik, egy új kutatási papír borzolja a kedélyeket egy meglepően egyszerű megközelítéssel: hagyják, hogy az autók egymás ellen játszva tanuljanak vezetni. Igen, jól olvasta. Olyan ez, mint egy digitális halálfutam, csak algoritmusokkal.
Gigaflow: Ahol az autók vezetési iskolába mennek (és káoszt okoznak)
A titkos összetevő a „Gigaflow” nevű rendszer, egy kötegelt szimulátor, amely képes 42 év szubjektív vezetési tapasztalatot szintetizálni és betanítani egyetlen óra alatt egy 8 GPU-s csomóponton. Képzeljen el egy digitális Thunderdome-ot, ahol az önvezető autók megszületnek, kapnak egy alapszabályzatot (ne ütközz, juss el a célhoz), majd szabadjára engedik őket, hogy virtuális utakon verekedjenek. Próba-szerencse alapon tanulnak, folyamatosan alkalmazkodva egymás… nevezzük „egyedi” vezetési stílusához.
Érdekesség: Csupán 10 napos tanulás során ezek az AI autók több mint 1,6 milliárd kilométert vezettek –
ez több, mint a Föld és a Szaturnusz közötti távolság! Komoly utazás!
Az eredmény? Egyetlen, kizárólag önmagával játszva betanított politika felülmúlja a korábbi legmodernebb teljesítményeket a CARLA, a nuPlan és a Waymo Open Motion Dataset adatkészleteken.
A „Minimalista jutalmazási függvény” – Vagy hogyan tanítsunk meg egy autót viselkedni (körülbelül)
Itt jön a igazán érdekes rész. A kutatók nem terheltek rá az AI-ra terabájtnyi emberi vezetési adatot. Ehelyett egy „minimalista jutalmazási függvényt” alkalmaztak. Alapvetően az autók jutalmat kapnak, ha:
- Elérik a célállomást
- Elkerülik az ütközéseket
- Sávon belül maradnak
- Nem szegik meg a piros lámpát
- Ésszerű gyorsítást tartanak fenn
Tekintsen rá úgy, mint egy kiskutya idomítására. Nem kell órákig videókat mutatnia neki jól viselkedő kutyákról. Egyszerűen ad egy jutalomfalatot, ha leül, és megdorgálja, ha megrágja a kedvenc cipőjét.
A jó, a rossz és a teljesen nevetséges
A jó hír az, hogy ez a megközelítés működni látszik. A végeredményként kapott politika a legmodernebb teljesítményt nyújtja több autonóm vezetési mérvadón is, még azokat is felülmúlja, amelyeket valós emberi adatokon tanítottak. Az autók meglepően robusztusak is, szimulációban átlagosan 17,5 év folyamatos vezetés után következik be náluk incidens.
A rossz hír? Nos, ha az autók úgy tanulnak vezetni, mint mi, az azt is jelenti, hogy megtanulják a rossz szokásainkat is. Számítson arra, hogy az önvezető autók egymást vágják ki, passzív-agresszív sávváltásokat hajtanak végre, és talán még egy AI-vezérelt közúti dühkitörés is előfordul.
És a teljesen nevetséges? Képzeljen el egy olyan jövőt, ahol az önvezető autók túlzottan udvariasak, minden gyalogosnak elsőbbséget adnak, és mindenkit beengednek maguk elé. A forgalom állandóan lelassulna, ahogy ezek a hiper-udvarias autók végtelen „Ön után, nem, Ön után” ciklusokba bonyolódnak.
A jövő (remélhetőleg) kevésbé rögös
Természetesen még hosszú út áll előttünk. Amint a kutatók maguk is rámutatnak, az AI tesztelés során elszenvedett szabálysértések nagy része a mérési keretrendszerek korlátaiból fakadt, például amikor gyalogosok hirtelen berohantak a forgalomba anélkül, hogy körülnéztek volna. De az a tény, hogy az önvezető autók képesek megtanulni navigálni összetett, kiszámíthatatlan környezetben az önmagukkal való játék révén, hatalmas előrelépés.
Tehát, amikor legközelebb lát egy önvezető autót az úton, ne feledje, hogy az valószínűleg több szimulált dugót és majdnem-balesetet élt át, mint Ön az egész élete során. És ha ki akarja vágni, csak emlékezzen: valószínűleg csak a legjobbak (vagy a legrosszabbak) közülünk tanul.
A szerkesztőség megjegyzése: Az AI rendszer létrehozása során egyetlen valódi autót sem bántottak.
Bár néhány virtuálisnak biztosan rossz napja volt az irodában.