Soyons honnêtes : la promesse des voitures autonomes nous nargue depuis des années, comme une carotte au bout d’un bâton. On nous a promis des chauffeurs robots, des trajets sans stress et la possibilité de finir enfin ces mots croisés sur le chemin du travail. Mais la réalité a été quelque peu… cahoteuse.
Jusqu’à maintenant, apparemment. Un nouveau document fait sensation avec une approche étonnamment simple : laisser les voitures apprendre à conduire en s’affrontant les unes contre les autres. Oui, vous avez bien lu. C’est comme un derby de démolition, mais avec des algorithmes.
Gigaflow : L’auto-école des voitures (et le chaos qui en découle)
L’ingrédient secret est un système appelé “Gigaflow”, un simulateur par lots capable de synthétiser et d’entraîner l’équivalent de 42 années d’expérience de conduite subjective par heure sur un seul nœud de 8 GPU. Imaginez un Thunderdome numérique où les voitures autonomes sont créées, reçoivent un ensemble de règles de base (ne pas s’écraser, atteindre la destination), puis sont lâchées pour s’affronter sur des routes virtuelles. Elles apprennent par essais et erreurs, s’adaptant constamment aux styles de conduite… disons “uniques” des autres.
Fait amusant : En seulement 10 jours d'entraînement, ces voitures IA ont parcouru plus de 1,6 milliard
de kilomètres - c'est plus que la distance de la Terre à Saturne ! Sacré road trip...
Le résultat ? Une seule politique entraînée entièrement par auto-apprentissage surpasse les performances de l’état de l’art précédent sur CARLA, nuPlan et le jeu de données Waymo Open Motion.
La “Fonction de Récompense Minimaliste” – Ou comment apprendre à une voiture à se comporter (plus ou moins)
Voici la partie vraiment intéressante. Les chercheurs n’ont pas gavé l’IA de téraoctets de données de conduite humaine. À la place, ils ont utilisé une “fonction de récompense minimaliste”. En gros, les voitures sont récompensées pour :
- Atteindre leur destination
- Éviter les collisions
- Rester dans leur voie
- Ne pas griller les feux rouges
- Maintenir une accélération raisonnable
C’est comme dresser un chiot. Pas besoin de lui montrer des heures de vidéos de chiens bien élevés. Il suffit de le récompenser quand il s’assoit et de le gronder quand il mâchouille vos chaussures préférées.
Le Bon, la Brute et le Franchement Hilarant
La bonne nouvelle est que cette approche semble fonctionner. La politique résultante atteint des performances état de l’art sur plusieurs références de conduite autonome, surpassant même les systèmes entraînés sur des données humaines réelles. Les voitures sont aussi étonnamment robustes, avec une moyenne de 17,5 années de conduite continue entre les incidents en simulation.
La mauvaise nouvelle ? Si les voitures apprennent à conduire comme nous, cela signifie qu’elles apprennent aussi nos mauvaises habitudes. Attendez-vous à voir des voitures autonomes se couper la route, s’engager dans des insertions passives-agressives, et peut-être même quelques incidents de rage au volant propulsés par l’IA.
Et le franchement hilarant ? Imaginez un futur où les voitures autonomes sont programmées pour être excessivement polies, cédant le passage à chaque piéton et laissant tout le monde s’insérer devant elles. La circulation serait paralysée par ces voitures hyper-courtoises engagées dans des boucles sans fin de “après vous, non, après vous.”
L’Avenir est (Espérons-le) Moins Cahoteux
Bien sûr, il reste encore beaucoup de chemin à parcourir. Comme les chercheurs le soulignent eux-mêmes, de nombreuses infractions commises par l’IA pendant les tests étaient dues aux limitations des références elles-mêmes, comme des piétons se jetant dans la circulation sans regarder. Mais le fait que les voitures autonomes puissent apprendre à naviguer dans des environnements complexes et imprévisibles par auto-apprentissage est une avancée majeure.
Donc, la prochaine fois que vous verrez une voiture autonome sur la route, rappelez-vous qu’elle a probablement traversé plus d’embouteillages simulés et frôlé plus d’accidents que vous dans toute votre vie. Et si elle vous coupe la route, souvenez-vous : elle apprend probablement des meilleurs (ou des pires) d’entre nous.
Note de la rédaction : Aucune voiture réelle n'a été maltraitée durant la création de ce système d'IA.
Même si certaines voitures virtuelles ont clairement passé une mauvaise journée au bureau.