Die selbstfahrenden Autos lernen es endlich - voneinander!
Seien wir mal ehrlich: Das Versprechen selbstfahrender Autos wurde uns jahrelang wie eine Karotte vor der Nase herumgehalten. Man versprach uns Roboter-Chauffeure, stressfreies Pendeln und die Möglichkeit, endlich das Kreuzworträtsel auf dem Weg zur Arbeit zu lösen. Aber die Realität war etwas… holprig.
Bis jetzt, wie es scheint. Eine neue Studie sorgt mit einem überraschend einfachen Ansatz für Aufsehen: Die Autos lernen das Fahren, indem sie gegeneinander spielen. Ja, Sie haben richtig gelesen. Es ist wie ein Destruction Derby, nur mit Algorithmen.
Gigaflow: Wo Autos zur Fahrschule gehen (und Chaos stiften)
Das Geheimrezept ist ein System namens “Gigaflow”, ein Batch-Simulator, der auf einem einzelnen 8-GPU-Knoten 42 Jahre subjektive Fahrerfahrung pro Stunde synthetisieren und trainieren kann. Stellen Sie sich eine digitale Thunderdome vor, in der selbstfahrende Autos ins Leben gerufen werden, grundlegende Regeln erhalten (nicht crashen, ans Ziel kommen) und dann losgelassen werden, um es auf virtuellen Straßen miteinander auszufechten. Sie lernen durch Versuch und Irrtum und passen sich ständig an die… nennen wir sie mal “einzigartigen” Fahrstile der anderen an.
Fun Fact: In nur 10 Trainingstagen legten diese KI-Autos über 1,6 Milliarden Kilometer zurück -
das ist mehr als die Entfernung von der Erde zum Saturn! Das nenne ich mal einen Roadtrip...
Das Ergebnis? Eine einzige, ausschließlich durch Selbstspiel trainierte Policy übertrifft bisherige Spitzenleistungen bei CARLA, nuPlan und dem Waymo Open Motion Dataset.
Die “minimalistische Belohnungsfunktion” – Oder: Wie man einem Auto Benehmen beibringt (mehr oder weniger)
Hier wird es wirklich interessant. Die Forscher fütterten die KI nicht mit Terabytes an menschlichen Fahrdaten. Stattdessen verwendeten sie eine “minimalistische Belohnungsfunktion”. Im Grunde werden die Autos belohnt für:
- Das Erreichen ihres Ziels
- Das Vermeiden von Kollisionen
- Das Bleiben in der Spur
- Das Nicht-Überfahren roter Ampeln
- Das Halten einer vernünftigen Beschleunigung
Denken Sie daran wie beim Training eines Welpen. Man muss ihm keine stundenlangen Videos von wohlerzogenen Hunden zeigen. Man gibt ihm einfach ein Leckerli, wenn er sitzt, und schimpft, wenn er an den Lieblingsschuhen kaut.
Das Gute, das Schlechte und das absolut Komische
Die gute Nachricht ist, dass dieser Ansatz zu funktionieren scheint. Die resultierende Policy erreicht Spitzenleistungen bei mehreren Benchmarks für autonomes Fahren und übertrifft sogar Systeme, die mit echten menschlichen Daten trainiert wurden. Die Autos sind auch überraschend robust und schaffen in der Simulation durchschnittlich 17,5 Jahre kontinuierliches Fahren zwischen Vorfällen.
Die schlechte Nachricht? Nun, wenn die Autos lernen wie wir zu fahren, bedeutet das auch, dass sie unsere schlechten Angewohnheiten übernehmen. Erwarten Sie selbstfahrende Autos, die sich gegenseitig schneiden, passive-aggressive Spurwechsel vollziehen und vielleicht sogar gelegentliche KI-gesteuerte Fälle von Verkehrswut zeigen.
Und das absolut Komische? Stellen Sie sich eine Zukunft vor, in der selbstfahrende Autos darauf programmiert sind, übertrieben höflich zu sein, jedem Fußgänger Vorrang zu gewähren und jeden vor sich einscheren zu lassen. Der Verkehr würde zum Erliegen kommen, während diese überhöflichen Autos in endlosen Schleifen von “nach Ihnen, nein, nach Ihnen” verfangen sind.
Die Zukunft ist (hoffentlich) weniger holprig
Natürlich ist noch ein weiter Weg zu gehen. Wie die Forscher selbst anmerken, waren viele der Verstöße der KI während der Tests auf Einschränkungen der Benchmarks selbst zurückzuführen, wie etwa Fußgänger, die ohne zu schauen in den Verkehr springen. Aber die Tatsache, dass selbstfahrende Autos durch Selbstspiel lernen können, komplexe, unvorhersehbare Umgebungen zu navigieren, ist ein großer Schritt nach vorn.
Wenn Sie also das nächste Mal ein selbstfahrendes Auto auf der Straße sehen, denken Sie daran: Es hat wahrscheinlich mehr simulierte Staus und Beinahe-Unfälle erlebt als Sie in Ihrem ganzen Leben. Und wenn es Sie schneidet, denken Sie einfach daran: Es lernt vermutlich nur von den Besten (oder Schlimmsten) von uns.
Anmerkung der Redaktion: Bei der Entwicklung dieses KI-Systems wurden keine echten Autos verletzt.
Einige virtuelle hatten allerdings definitiv einen harten Arbeitstag.