Les voitures autonomes disposent d'une batterie de capteurs, qui permettent de lui dire comment conduire, avec une longue liste de règles soigneusement conçues et pensées. Et si nous laissions une voiture apprendre à suivre sa voie ? Et si, au fur et à mesure d'essais et d'erreurs, la voiture parvenait à apprendre et à construire sa conduite ? C'est ce que propose Wayve.
« En seulement 15 à 20 minutes, il est possible d'apprendre à une voiture à suivre une ligne et à réagir, en partant d'une feuille blanche, simplement grâce à l'entrainement qu'elle réalise et aux retours que lui transmet son pilote » expliquent les créateurs de Wayve.
Apprendre à conduire avec l'apprentissage par renforcement
Wayve, c'est une start-up anglaise créée par des chercheurs de l'université de Cambridge, qui fait appel à l'apprentissage par renforcement. Pas de mapping en 3D de la route, pas de règles et pas de développement en amont. L'un des algorithmes de référence, DDPG, a été implémenté et amélioré, pour que la voiture apprenne à « tenir sa ligne ». Une seule source visuelle traitée par un processeur graphique embarqué permet à la Renault Twizy utilisée par les chercheurs de tâtonner et d'apprendre.La voiture serpente et sort de sa ligne. Le conducteur corrige. La voiture refait une erreur. Il corrige de nouveau. L'auto apprend, et comprend que le fait de rester entre les lignes est la bonne solution. Dans sa vidéo baptisée « apprendre à conduire en 1 journée », la start-up nous dévoile les coulisses de cette expérience.
Quatre épisodes d'exploration se succèdent. La voiture fait des erreurs, elle est corrigée. Ensuite, une première évaluation a lieu. La voiture parvient à couvrir quelques mètres, puis elle quitte la route... De nouveaux épisodes d'exploration se succèdent, avec une conduite optimisée grâce aux retours effectués par le conducteur. Après 11 sessions d'essais seulement, la voiture reste sur la route toute seule.
Le « super-conducteur », l'avenir de l'automobile ?
Que sert à prouver ce projet ? Quelles sont les possibilités qu'ouvre cette démarche ? L'idée est de construire une intelligence artificielle qui, aidée par de bons conducteurs, puisse donner naissance à une voiture autonome dont les compétences seraient supérieures à n'importe quel conducteur, le plus prudent soit-il. Un « super-conducteur ».DeepMind, la filiale de Google spécialisée en intelligence artificielle, a montré que les méthodes d'apprentissage par renforcement profond peuvent conduire à des performances exceptionnelles. On l'a vu avec le jeu de Go ou les échecs, l'intelligence artificielle surpassant l'homme. Wayve veut en faire de même, avec l'automobile. « Nous montrons ici qu'une philosophie similaire est applicable dans le monde réel, et en particulier avec les véhicules autonomes. Un point crucial à noter est que les algorithmes de jeu de DeepMind ont nécessité des millions d'essais pour résoudre une tâche. Il est remarquable que nous ayons appris à une voiture à suivre une direction... en moins de 20 essais ! »