Dobre ľudia, povedzme si úprimne: prísľub samočinne riadených áut sa pred nami vznáša ako mrkva na palici už roky. Sľubovali nám robotických šoférov, bezstresové dochádzanie a konečne možnosť dokončiť krížovku cestou do práce. Realita však bola trochu… hrboľatá.
Zdá sa však, že až doteraz. Nová štúdia vzbudzuje rozruch prekvapivo jednoduchým prístupom: nechať autá učiť sa jazdiť tak, že súťažia proti sebe navzájom. Áno, čítate správne. Je to ako demolačné derby, ale s algoritmami.
Gigaflow: Kde autá chodia do autoškoly (a robia neplechu)
Tajnou ingredienciou je systém nazvaný “Gigaflow”, dávkový simulátor schopný syntetizovať a trénovať 42 rokov subjektívnych jazdných skúseností za hodinu na jednom 8-GPU uzle. Predstavte si digitálnu arénu, kde sa samočinne riadené autá rodia do existencie, dostanú základný súbor pravidiel (nenaraziť, dostať sa do cieľa) a potom sú vypustené, aby to medzi sebou rozdali na virtuálnych cestách. Učia sa metódou pokus-omyl, neustále sa prispôsobujúc… povedzme “jedinečným” štýlom jazdy jeden druhého.
Zaujímavosť: Za len 10 dní tréningu tieto AI autá najazdili vyše 1,6 miliardy kilometrov -
to je viac ako vzdialenosť zo Zeme na Saturn! To je poriadny roadtrip...
Výsledok? Jediná stratégia trénovaná výlučne prostredníctvom vzájomnej hry prekonáva doterajšie najlepšie výkony na CARLA, nuPlan a Waymo Open Motion Dataset.
“Minimalistická odmeňovacia funkcia” – alebo ako naučiť auto správať sa (aspoň trochu)
Tu prichádza skutočne zaujímavá časť. Výskumníci nekŕmili AI terabajtmi údajov o ľudskom šoférovaní. Namiesto toho použili “minimalistickú odmeňovaciu funkciu”. V podstate sú autá odmeňované za:
- Dosiahnutie cieľa
- Vyhýbanie sa kolíziám
- Zotrvanie v jazdnom pruhu
- Nerušenie červenej na semafore
- Udržiavanie rozumného zrýchlenia
Je to ako trénovať šteňa. Nepotrebujete mu ukazovať hodiny videí dobre vychovaných psov. Stačí mu dať maškrtu, keď si sadne, a pokarhať ho, keď prežúva vaše obľúbené topánky.
Dobré, zlé a vyslovene zábavné
Dobrou správou je, že tento prístup sa zdá byť účinný. Výsledná stratégia dosahuje najlepšie výsledky v rôznych testoch autonómnej jazdy, dokonca prekonáva systémy trénované na reálnych ľudských údajoch. Autá sú tiež prekvapivo odolné, v simulácii prejdú v priemere 17,5 roka nepretržitej jazdy medzi incidentmi.
Zlou správou? No, ak sa autá učia jazdiť ako my, znamená to, že sa učia aj naše zlé návyky. Očakávajte, že samočinne riadené autá sa budú navzájom vytláčať, agresívne-pasívne sa zlučovať v pruhoch a možno sa dočkáme aj občasného prejavu cestnej agresivity poháňaného AI.
A to vyslovene zábavné? Predstavte si budúcnosť, kde sú samočinne riadené autá naprogramované byť prehnane zdvorilé, ustupujúc každému chodcovi a nechávajúc všetkých zaradiť sa pred ne. Premávka by sa zastavila, keď by sa tieto hyper-slušné autá dostali do nekonečných slučiek “po vás, nie, po vás.”
Budúcnosť je (dúfajme) menej hrboľatá
Samozrejme, ešte je pred nami dlhá cesta. Ako poznamenávajú samotní výskumníci, mnohé priestupky AI počas testovania boli spôsobené obmedzeniami samotných testovacích kritérií, ako napríklad chodci vrhajúci sa do premávky bez obzerania. Ale fakt, že samočinne riadené autá sa dokážu naučiť navigovať v komplexných, nepredvídateľných prostrediach prostredníctvom vzájomnej hry, je významným krokom vpred.
Takže nabudúce, keď uvidíte samočinne riadené auto na ceste, pamätajte, že pravdepodobne prešlo viacerými simulovanými dopravnými zápchami a takmer nehodami než vy za celý život. A ak vás vytlačí, len si spomente: pravdepodobne sa učí od najlepších (alebo najhorších) z nás.
Poznámka redakcie: Pri vývoji tohto AI systému neboli poškodené žiadne skutočné autá.
Aj keď niektoré virtuálne mali v práci určite náročný deň.