자율주행차: 드디어 우리처럼 운전하기 시작했는데 (좀 무섭기도 하네요) | RoboHorizon Robot Magazine

A jövő már itt van: önvezető autók, amelyek egymással versenyezve tanulnak

Cím: Önvezető autók: A káosz iskolája (és a jövő receptje) Leírás: Elfelejthetjük a valós adatok hegyeit. A legújabb kutatás szerint az önvezető rendszerek úgy tanulnak meg vezetni, hogy egymás ellen versenyeznek a szimulációban. Humorral és némi pánikkal.

Nos, emberek, nézzük szembe a ténnyel: az önvezető autók ígérete évek óta lóg előttünk, mint egy cukorka egy bot végén. Robot sofőröket, stresszmentes ingázást és azt az áldott pillanatot ígértek, amikor végre befejezhetjük a keresztrejtvényt a munkahelyre tartva. De a valóság kissé… rögösnek bizonyult.

Eddig. Úgy tűnik, egy új kutatási papír borzolja a kedélyeket egy meglepően egyszerű megközelítéssel: hagyják, hogy az autók egymás ellen játszva tanuljanak vezetni. Igen, jól olvasta. Olyan ez, mint egy digitális halálfutam, csak algoritmusokkal.

Gigaflow: Ahol az autók vezetési iskolába mennek (és káoszt okoznak)

A titkos összetevő a „Gigaflow” nevű rendszer, egy kötegelt szimulátor, amely képes 42 év szubjektív vezetési tapasztalatot szintetizálni és betanítani egyetlen óra alatt egy 8 GPU-s csomóponton. Képzeljen el egy digitális Thunderdome-ot, ahol az önvezető autók megszületnek, kapnak egy alapszabályzatot (ne ütközz, juss el a célhoz), majd szabadjára engedik őket, hogy virtuális utakon verekedjenek. Próba-szerencse alapon tanulnak, folyamatosan alkalmazkodva egymás… nevezzük „egyedi” vezetési stílusához.

Érdekesség: Csupán 10 napos tanulás során ezek az AI autók több mint 1,6 milliárd kilométert vezettek –
ez több, mint a Föld és a Szaturnusz közötti távolság! Komoly utazás!

Az eredmény? Egyetlen, kizárólag önmagával játszva betanított politika felülmúlja a korábbi legmodernebb teljesítményeket a CARLA, a nuPlan és a Waymo Open Motion Dataset adatkészleteken.

A „Minimalista jutalmazási függvény” – Vagy hogyan tanítsunk meg egy autót viselkedni (körülbelül)

Itt jön a igazán érdekes rész. A kutatók nem terheltek rá az AI-ra terabájtnyi emberi vezetési adatot. Ehelyett egy „minimalista jutalmazási függvényt” alkalmaztak. Alapvetően az autók jutalmat kapnak, ha:

Elérik a célállomást
Elkerülik az ütközéseket
Sávon belül maradnak
Nem szegik meg a piros lámpát
Ésszerű gyorsítást tartanak fenn

Tekintsen rá úgy, mint egy kiskutya idomítására. Nem kell órákig videókat mutatnia neki jól viselkedő kutyákról. Egyszerűen ad egy jutalomfalatot, ha leül, és megdorgálja, ha megrágja a kedvenc cipőjét.

A jó, a rossz és a teljesen nevetséges

A jó hír az, hogy ez a megközelítés működni látszik. A végeredményként kapott politika a legmodernebb teljesítményt nyújtja több autonóm vezetési mérvadón is, még azokat is felülmúlja, amelyeket valós emberi adatokon tanítottak. Az autók meglepően robusztusak is, szimulációban átlagosan 17,5 év folyamatos vezetés után következik be náluk incidens.

A rossz hír? Nos, ha az autók úgy tanulnak vezetni, mint mi, az azt is jelenti, hogy megtanulják a rossz szokásainkat is. Számítson arra, hogy az önvezető autók egymást vágják ki, passzív-agresszív sávváltásokat hajtanak végre, és talán még egy AI-vezérelt közúti dühkitörés is előfordul.

És a teljesen nevetséges? Képzeljen el egy olyan jövőt, ahol az önvezető autók túlzottan udvariasak, minden gyalogosnak elsőbbséget adnak, és mindenkit beengednek maguk elé. A forgalom állandóan lelassulna, ahogy ezek a hiper-udvarias autók végtelen „Ön után, nem, Ön után” ciklusokba bonyolódnak.

A jövő (remélhetőleg) kevésbé rögös

Természetesen még hosszú út áll előttünk. Amint a kutatók maguk is rámutatnak, az AI tesztelés során elszenvedett szabálysértések nagy része a mérési keretrendszerek korlátaiból fakadt, például amikor gyalogosok hirtelen berohantak a forgalomba anélkül, hogy körülnéztek volna. De az a tény, hogy az önvezető autók képesek megtanulni navigálni összetett, kiszámíthatatlan környezetben az önmagukkal való játék révén, hatalmas előrelépés.

Tehát, amikor legközelebb lát egy önvezető autót az úton, ne feledje, hogy az valószínűleg több szimulált dugót és majdnem-balesetet élt át, mint Ön az egész élete során. És ha ki akarja vágni, csak emlékezzen: valószínűleg csak a legjobbak (vagy a legrosszabbak) közülünk tanul.

A szerkesztőség megjegyzése: Az AI rendszer létrehozása során egyetlen valódi autót sem bántottak.
Bár néhány virtuálisnak biztosan rossz napja volt az irodában.

Forrás: Robust Autonomy Emerges from Self-Play

Gigaflow: Ahol az autók vezetési iskolába mennek (és káoszt okoznak)

A „Minimalista jutalmazási függvény” – Vagy hogyan tanítsunk meg egy autót viselkedni (körülbelül)

A jó, a rossz és a teljesen nevetséges

A jövő (remélhetőleg) kevésbé rögös

로봇, 벽 플립 성공: OmniRetarget 혁신

AI 로봇, 오토바이 묘기에서 인간 능가하다

VR 조종 대포: 메카 전쟁의 서막

CARA: 로프 구동 로봇견의 혁명

AGIBOT, 휠 변신 기능 탑재한 네자(Nezha) 영감 휴머노이드 X2-N 공개

BOMB: NVIDIA, Jim Fan 이끄는 최정예 휴머노이드 로봇팀 구축

Boring Company, Úttörő Autonóm Alagútfúrási Mérföldkőhöz Érkezett

Neura MiPa: 최초의 가정용 로봇 예약 주문 시작

UGOKU Pad, 자이로스코프 장치 Gen2에 스마트폰 제어 기능 도입

Loki Robotics의 청소 로봇, 지루한 사무실 업무를 맡다

EngineAI의 PM01 휴머노이드 로봇, 13,700달러에 등장!

유럽 로봇 전략: 개방적이되 순진하지 않게

AI와 로봇공학, 미국 사회의 공통 관심사는 무엇일까요?