Samochody autonomiczne: W końcu uczą się jeździć jak my (i to przeraża) | RoboHorizon Robot Magazine

Pożegnajcie marzenia o autonomicznych samochodach – nadchodzi era wirtualnej szkoły jazdy

Bądźmy szczerzy: obietnica samochodów autonomicznych wisiała przed nami jak marchewka na patyku przez lata. Obiecywano nam robotycznych szoferów, bezstresowe dojazdy do pracy i możliwość spokojnego rozwiązania krzyżówki w trakcie podróży. Ale rzeczywistość okazała się nieco… wyboistsza.

Aż do teraz, jak się wydaje. Nowy artykuł naukowy wywołuje sensację zaskakująco prostym podejściem: pozwólmy samochodom nauczyć się jazdy, rywalizując ze sobą nawzajem. Tak, dobrze przeczytaliście. To jak demolition derby, tylko że z algorytmami.

Gigaflow: gdzie samochody uczęszczają do szkoły jazdy (i sieją chaos)

Tajnym składnikiem jest system o nazwie “Gigaflow”, wsadowy symulator zdolny do syntetyzowania i szkolenia na podstawie 42 lat subiektywnego doświadczenia w prowadzeniu pojazdów w ciągu godziny, na pojedynczym węźle z 8 GPU. Wyobraźcie sobie cyfrową arenę, gdzie autonomiczne samochody są powoływane do istnienia, otrzymują podstawowy zestaw zasad (nie rozbij się, dotrzyj do celu) i zostają wypuszczone, by walczyć na wirtualnych drogach. Uczą się metodą prób i błędów, nieustannie dostosowując się do… nazwijmy to “unikalnych” stylów jazdy innych pojazdów.

Ciekawostka: W zaledwie 10 dni treningu, te AI-samochody przejechały ponad 1,6 miliarda kilometrów - 
to więcej niż odległość z Ziemi do Saturna! Niezła wycieczka...

Rezultat? Pojedyncza strategia wytrenowana wyłącznie poprzez samouczącą się grę przewyższa dotychczasowe najlepsze wyniki na platformach CARLA, nuPlan i zbiorze danych Waymo Open Motion.

“Minimalistyczna funkcja nagrody” – czyli jak nauczyć samochód przyzwoitego zachowania (mniej więcej)

Oto naprawdę interesująca część. Badacze nie karmili AI terabajtami danych o ludzkiej jeździe. Zamiast tego zastosowali “minimalistyczną funkcję nagrody”. W zasadzie, samochody są nagradzane za:

Dotarcie do celu
Unikanie kolizji
Trzymanie się swojego pasa
Nieignorowanie czerwonych świateł
Utrzymywanie rozsądnego przyspieszenia

To jak tresowanie szczeniaka. Nie musisz pokazywać mu godzin filmów z dobrze wychowanymi psami. Po prostu dajesz mu smakołyk, gdy siada i ganisz, gdy gryzie twoje ulubione buty.

Dobre, złe i absolutnie zabawne

Dobra wiadomość jest taka, że to podejście wydaje się działać. Powstała strategia osiąga najlepsze wyniki w wielu testach porównawczych autonomicznej jazdy, przewyższając nawet systemy trenowane na rzeczywistych danych ludzkiej jazdy. Samochody są również zaskakująco wytrzymałe, osiągając średnio 17,5 lat ciągłej jazdy między incydentami w symulacji.

Zła wiadomość? Cóż, jeśli samochody uczą się jeździć jak my, oznacza to, że przejmują również nasze złe nawyki. Spodziewajcie się, że autonomiczne samochody będą zajeżdżać sobie drogę, agresywnie-pasywnie zmieniać pasy i być może doświadczymy nawet okazjonalnych incydentów wściekłości drogowej napędzanej przez AI.

A co absolutnie zabawne? Wyobraźcie sobie przyszłość, w której autonomiczne samochody są zaprogramowane, by być przesadnie uprzejme, ustępując każdemu pieszemu i pozwalając wszystkim wjeżdżać przed siebie. Ruch uliczny stanąłby w miejscu, gdy te nadmiernie kurtuazyjne pojazdy wdawałyby się w niekończące się pętle “po tobie, nie, po tobie”.

Przyszłość jest (miejmy nadzieję) mniej wyboista

Oczywiście, jest jeszcze długa droga przed nami. Jak sami badacze wskazują, wiele wykroczeń popełnianych przez AI podczas testów wynikało z ograniczeń samych testów porównawczych, na przykład pieszych wbiegających na jezdnię bez rozglądania się. Ale fakt, że autonomiczne samochody mogą nauczyć się nawigować w złożonych, nieprzewidywalnych środowiskach poprzez samouczącą się grę, stanowi ogromny krok naprzód.

Więc następnym razem, gdy zobaczysz autonomiczny samochód na drodze, pamiętaj, że prawdopodobnie przeszedł więcej symulowanych korków i sytuacji bliskich wypadkom niż ty doświadczyłeś w całym swoim życiu. A jeśli zajedzie ci drogę, pamiętaj: prawdopodobnie uczy się od najlepszych (lub najgorszych) z nas.

Uwaga redakcji: Żadne prawdziwe samochody nie ucierpiały podczas tworzenia tego systemu AI. 
Choć niektóre wirtualne zdecydowanie miały ciężki dzień w pracy.

Źródło: Robust Autonomy Emerges from Self-Play