Samovozeči avtomobili: Končno se učijo voziti kot mi (in to je malo strašljivo)

V redu, ljudje, priznajmo: obljuba samovodečih avtomobilov že leta visi pred nami kot korenček na palici. Obljubljali so nam robotske šoferje, vožnje brez stresa in možnost, da končno rešimo križanko na poti v službo. Toda realnost je bila nekoliko… razgibana.

Vse do zdaj, kot kaže. Nov članek povzroča valove s presenetljivo preprostim pristopom: pustimo avtomobilom, da se naučijo voziti tako, da se spopadejo drug z drugim. Ja, prav ste prebrali. Je kot derby z rušenjem, le da z algoritmi.

Gigaflow: Kjer avtomobili hodijo v šolo vožnje (in povzročajo kaos)

Skrivni dodatek je sistem imenovan “Gigaflow”, paketni simulator, ki lahko sintetizira in trenira 42 let subjektivnih vozniških izkušenj na uro na enem samem 8-GPU vozlišču. Predstavljajte si digitalni Thunderdome, kjer samovozeči avtomobili vzniknejo v obstoj, dobijo osnovni nabor pravil (ne trči, pridi do cilja) in so nato spuščeni, da se spopadejo na virtualnih cestah. Učijo se s poskusi in napakami, nenehno se prilagajajo “edinstvenim” voznim stilom drug drugega.

Zanimivost: V samo 10 dneh treninga so ti AI avtomobili prevozili več kot 1,6 milijarde 
kilometrov - to je več kot razdalja od Zemlje do Saturna! Govorimo o pravi road trip pustolovščini...

Rezultat? Ena sama strategija, trenirana izključno preko samouporabe, presega prejšnje najsodobnejše rezultate na CARLA, nuPlan in Waymo Open Motion Dataset.

“Minimalistična funkcija nagrade” – Ali, kako naučiti avto obnašanja (nekako)

Tukaj je resnično zanimiv del. Raziskovalci niso hranili UI s terabajti podatkov o človeški vožnji. Namesto tega so uporabili “minimalistično funkcijo nagrade”. V osnovi so avtomobili nagrajeni za:

  • Doseganje cilja
  • Izogibanje trkom
  • Ohranjanje svojega pasu
  • Neustavlanje pri rdeči luči
  • Ohranjanje razumnega pospeševanja

Pomislite na to kot na treniranje kužka. Ne potrebujete mu pokazati ur posnetkov lepo vzgojenih psov. Samo nagradite ga, ko sede, in ga okregajte, ko žveči vaše najljubše čevlje.

Dobro, slabo in naravnost smešno

Dobra novica je, da ta pristop očitno deluje. Rezultirajoča strategija dosega najsodobnejše rezultate na več primerjalnih testih avtonomne vožnje in celo presega sisteme, trenirane na resničnih človeških podatkih. Avtomobili so tudi presenetljivo robustni in v simulaciji v povprečju prevozijo 17,5 let neprekinjene vožnje med incidenti.

Slaba novica? No, če se avtomobili učijo voziti kot mi, to pomeni, da se učijo tudi naših slabih navad. Pričakujte, da boste videli samovozeče avtomobile, ki si režejo pot, se agresivno-pasivno vključujejo v promet in morda celo občasne incidente cestne jeze, ki jih poganja UI.

In naravnost smešno? Predstavljajte si prihodnost, kjer so samovozeči avtomobili programirani, da so pretirano vljudni, prepuščajo pot vsakemu pešcu in pustijo vsem, da se vključijo pred njih. Promet bi se ustavil, ko bi se ti super vljudni avtomobili zapletli v neskončne kroge “za vami, ne, za vami.”

Prihodnost je (upajmo) manj razgibana

Seveda je še dolga pot pred nami. Kot poudarjajo raziskovalci sami, so bili mnogi prekrški UI med testiranjem posledica omejitev samih primerjalnih testov, kot so pešci, ki skočijo v promet brez gledanja. Vendar je dejstvo, da se samovozeči avtomobili lahko naučijo krmariti po kompleksnih, nepredvidljivih okoljih preko samouporabe, velik korak naprej.

Torej, ko naslednjič vidite samovodeči avtomobil na cesti, se spomnite, da je verjetno prestal več simuliranih prometnih zastojev in skorajšnjih trkov kot vi v celotnem življenju. In če vam prereže pot, se le spomnite: verjetno se uči od najboljših (ali najslabših) med nami.

Uredniška opomba: Pri izdelavi tega UI sistema ni bil poškodovan noben resničen avtomobil. 
Čeprav so nekateri virtualni definitivno imeli težak dan v službi.

Vir: Robustna avtonomija se pojavi iz samouporabe