Autonomna vozila: Konačno uče voziti kao mi (i to je pomalo zastrašujuće)

U redu, ljudi, suočimo se s istinom: obećanje samovozećih automobila već nam godinama visi pred nosom poput mrkve na štapu. Obećani su nam robotski vozači, putovanja bez stresa i mogućnost da konačno riješimo onu križaljku na putu do posla. Ali stvarnost je bila pomalo… neravna.

Čini se, do sada. Novi rad izaziva valove iznenađujuće jednostavnim pristupom: pustimo automobile da nauče voziti igrajući se jedni protiv drugih. Da, dobro ste pročitali. To je poput derby utrke, ali s algoritmima.

Gigaflow: Gdje Automobili Idu u Auto Školu (i Stvaraju Kaos)

Tajna je u sustavu nazvanom “Gigaflow”, simulatoru koji može sintetizirati i trenirati 42 godine subjektivnog vozačkog iskustva po satu na jednom 8-GPU čvoru. Zamislite digitalni Thunderdome gdje se samovozeći automobili stvaraju, dobivaju osnovni set pravila (ne sudaraj se, stigni do odredišta) i puštaju da se bore na virtualnim cestama. Uče metodom pokušaja i pogreške, konstantno se prilagođavajući… nazovimo ih “jedinstvenim” stilovima vožnje jedni drugih.

Zanimljiva činjenica: U samo 10 dana treninga, ovi AI automobili prešli su preko 1,6 milijardi 
kilometara - to je više od udaljenosti od Zemlje do Saturna! Kakav road trip...

Rezultat? Jedinstvena politika trenirana isključivo kroz samostalnu igru nadmašuje dosadašnje vrhunske rezultate na CARLA-i, nuPlanu i Waymo Open Motion Datasetu.

“Minimalistička Funkcija Nagrade” – Ili, Kako Naučiti Auto da se (Donekle) Ponaša

Evo zaista zanimljivog dijela. Istraživači nisu hranili AI terabajtima podataka o ljudskoj vožnji. Umjesto toga, koristili su “minimalističku funkciju nagrade”. U osnovi, automobili su nagrađeni za:

  • Dolazak na odredište
  • Izbjegavanje sudara
  • Ostajanje u svojoj traci
  • Neprolaske kroz crveno svjetlo
  • Održavanje razumnog ubrzanja

Zamislite to kao treniranje štenca. Ne trebate mu pokazivati sate video zapisa dobro odgojenih pasa. Samo mu date poslasticu kad sjedne i ukorite ga kad žvače vaše omiljene cipele.

Dobro, Loše i Urnebesno Smiješno

Dobra vijest je da ovaj pristup izgleda funkcionira. Rezultirajuća politika postiže vrhunske rezultate na više mjerila autonomne vožnje, čak nadmašujući sustave trenirane na stvarnim ljudskim podacima. Automobili su također iznenađujuće robusni, u prosjeku vozeći 17,5 godina kontinuirano između incidenata u simulaciji.

Loša vijest? Pa, ako automobili uče voziti poput nas, to znači da uče i naše loše navike. Očekujte da ćete vidjeti samovozeće automobile kako si presjecaju put, agresivno-pasivno se ubacuju u trake, i možda čak povremene incidente AI prometnog bijesa.

A ono urnebesno smiješno? Zamislite budućnost gdje su samovozeći automobili programirani da budu pretjerano pristojni, propuštajući svakog pješaka i dopuštajući svima da se ubace ispred njih. Promet bi stao dok se ovi ultra-pristojni automobili upuštaju u beskrajne krugove “izvolite vi, ne, izvolite vi.”

Budućnost je (Nadajmo se) Manje Neravna

Naravno, još uvijek ima puno posla. Kako i sami istraživači ističu, mnogi prekršaji koje je AI počinio tijekom testiranja bili su zbog ograničenja samih mjerila, poput pješaka koji skaču u promet bez gledanja. Ali činjenica da samovozeći automobili mogu naučiti navigirati kroz složena, nepredvidljiva okruženja kroz samostalnu igru predstavlja veliki korak naprijed.

Dakle, sljedeći put kada vidite samovozećí automobil na cesti, sjetite se da je vjerojatno prošao kroz više simuliranih prometnih gužvi i zamalo sudara nego vi u cijelom svom životu. A ako vam presječe put, samo se sjetite: vjerojatno uči od najboljih (ili najgorih) među nama.

Urednikova napomena: Nijedan stvarni automobil nije stradao u stvaranju ovog AI sustava. 
Iako su neki virtualni definitivno imali težak dan na poslu.

Izvor: Robust Autonomy Emerges from Self-Play