Samoupravljajući automobili: Konačno uče da voze kao mi (i to je pomalo zastrašujuće)

У реду, народе, суочимо се са истином: обећање самовозећих аутомобила нам виси пред носом годинама као шаргарепа на штапу. Обећани су нам роботски шофери, вожње без стреса и могућност да коначно решимо укрштеницу на путу до посла. Али реалност је била мало… неравна.

До сада, чини се. Нови научни рад прави таласе са изненађујуће једноставним приступом: пустити аутомобиле да уче вожњу такмичећи се међусобно. Да, добро сте прочитали. То је као дерби рушења, само са алгоритмима.

Gigaflow: Где аутомобили иду у ауто-школу (и праве хаос)

Тајни састојак је систем под називом “Gigaflow”, симулатор који може да синтетише и тренира 42 године субјективног возачког искуства по сату на једном чвору са 8 GPU-а. Замислите дигитални Тандердом где се самовозећи аутомобили стварају, добијају основни сет правила (не сударај се, стигни до одредишта) и пуштају се да се боре на виртуелним путевима. Уче кроз покушаје и грешке, константно се прилагођавајући… назовимо их “јединственим” стиловима вожње једни других.

Занимљива чињеница: За само 10 дана тренинга, ови АИ аутомобили су прешли преко 1,6 милијарди 
километара - то је више од раздаљине од Земље до Сатурна! Причамо о правом путовању...

Резултат? Једна политика тренирана искључиво кроз самоигру надмашује претходна најбоља достигнућа на CARLA, nuPlan и Waymo Open Motion Dataset.

“Минималистичка функција награде” – Или, како научити ауто да се понаша (донекле)

Ево заиста интересантног дела. Истраживачи нису хранили АИ терабајтима података о људској вожњи. Уместо тога, користили су “минималистичку функцију награде”. У суштини, аутомобили се награђују за:

Стизање на одредиште
Избегавање судара
Останак у својој траци
Непролажење кроз црвено светло
Одржавање разумног убрзања

Замислите то као тренирање штенета. Не морате му показивати сате снимака добро васпитаних паса. Само му дате посластицу када седне и прекорите га када жваће ваше омиљене ципеле.

Добро, лоше и урнебесно смешно

Добра вест је да овај приступ изгледа функционише. Резултујућа политика постиже врхунске резултате на више аутономних возачких тестова, чак надмашујући системе тренирани на подацима стварних људских возача. Аутомобили су такође изненађујуће издржљиви, у просеку возећи 17,5 година непрекидно између инцидената у симулацији.

Лоша вест? Па, ако аутомобили уче да возе као ми, то значи да уче и наше лоше навике. Очекујте да видите самовозеће аутомобиле како пресецају једни друге, укључују се у пасивно-агресивна спајања трака, и можда чак и повремене инциденте АИ путног беса.

А урнебесно смешно? Замислите будућност где су самовозећи аутомобили програмирани да буду претерано учтиви, пропуштајући сваког пешака и дозвољавајући свима да се укључе испред њих. Саобраћај би стао док се ови хипер-учтиви аутомобили упуштају у бескрајне петље “после вас, не, после вас.”

Будућност је (надамо се) мање неравна

Наравно, још увек има много посла. Као што сами истраживачи истичу, многи прекршаји које је АИ починио током тестирања били су због ограничења самих тестова, попут пешака који истрчавају у саобраћај без гледања. Али чињеница да самовозећи аутомобили могу научити да се крећу кроз сложена, непредвидива окружења кроз самоигру је велики корак напред.

Дакле, следећи пут када видите самовозећи аутомобил на путу, сетите се да је вероватно прошао кроз више симулираних саобраћајних гужви и избегнутих судара него ви у целом свом животу. А ако вам пресече пут, само се сетите: вероватно учи од најбољих (или најгорих) међу нама.

Напомена уредника: Ниједан стварни аутомобил није повређен током прављења овог АИ система.
Мада су неки виртуелни дефинитивно имали тежак дан на послу.

Извор: Robust Autonomy Emerges from Self-Play