Des IA apprennent le travail d'équipe en jouant à cache-cache

Benoît Théry
Publié le 22 septembre 2019 à 20h20
OpenAI entrainement IA
© OpenAI

L'intelligence artificielle se développe à une vitesse impressionnante. Il y a deux mois, Pluribus a marqué l'Histoire en battant cinq joueurs de poker à la fois. Au début de l'année, l'IA de Google, Deepmind a battu des joueurs professionnels à Starcraft II.

Cette fois-ci, c'est l'initiative d'OpenAI qui attire l'attention. L'IA américaine a prouvé sa capacité à apprendre en jouant en équipe à des parties de cache-cache.

De plus en plus fortes au cache-cache

On ne présentera pas le jeu du cache-cache. En revanche, lorsque ce jeu mondialement connu est présenté à une intelligence artificielle, celui-ci peut révéler comment cette dernière gère l'importance des décisions auxquelles elle est confrontée.

OpenAI, qui est basée à San Francisco, a rendu open-source un environnement d'entraînement destiné aux IA. Cet environnement a déjà été utilisé, mettant en scène différents acteurs contrôlés par des IA. Ceux-ci ont eu pour objectif de se cacher et de se trouver, déployant des techniques de plus en plus sophistiquées pour y parvenir. On retrouve sur les images ci-dessous l'évolution de ces techniques : si, dans un premier temps, les IA ont pu se contenter de se cacher, elles ont par la suite improvisé des constructions et détourné l'utilisation d'objets. Et surtout, ces IA ont travaillé ensemble pour atteindre un but commun.


Bien sûr, l'intelligence artificielle aura dû jouer un (très) grand nombre de parties pour parfaire son apprentissage. Ce n'est qu'après 25 millions de « matches » que les IA impliquées ont commencé à bâtir des abris improvisés. Avec 75 millions de matches supplémentaires, les « chercheurs » ont eu l'idée d'utiliser boîtes et rampes pour sauter dans ces abris.

OpenAI IA entrainement
© OpenAI

L'intérêt pour les travaux futurs

À terme, les IA impliquées ont réussi à élaborer des stratégies complexes dans un environnement qu'elles ne connaissaient pas a priori. Les chercheurs d'OpenAI expliquent ainsi : « Les succès rencontrés laissent penser que ces environnements pourraient permettre à des IA d'acquérir un nombre conséquent de... compétences. Ceci amène à un comportement centré sur des compétences beaucoup plus pertinentes pour l'être humain que d'autres méthodes d'apprentissage par renforcement ».

En d'autres termes, et au-delà des environnements de jeu, ces tests montrent que l'IA peut apprendre à élaborer elle-même de nouvelles techniques utiles, par exemple, dans le diagnostic médical ou la découverte de structures de protéines complexes.


Dans une précédente interview, Demis Hassabis, le co-fondateur de l'IA Alphabet Deepmind, a déclaré auprès du site VentureBeat : « À terme, nous développerons des algorithmes qui peuvent être transposés dans le monde réel, pour travailler à des défis réellement difficiles... et aider les experts de ces secteurs ».

Source : Venture Beat
Vous êtes un utilisateur de Google Actualités ou de WhatsApp ?
Suivez-nous pour ne rien rater de l'actu tech !
Commentaires (0)
Rejoignez la communauté Clubic
Rejoignez la communauté des passionnés de nouvelles technologies. Venez partager votre passion et débattre de l’actualité avec nos membres qui s’entraident et partagent leur expertise quotidiennement.
Commentaires (2)
clafouti

L’ère de Skynet arrive !

sandalfo

" À terme, nous développerons des algorithmes qui peuvent être transposés dans le monde réel, pour travailler à des défis réellement difficiles."
Comme conduire une voiture par exemple ?

Abonnez-vous à notre newsletter !

Recevez un résumé quotidien de l'actu technologique.

Désinscrivez-vous via le lien de désinscription présent sur nos newsletters ou écrivez à : [email protected]. en savoir plus sur le traitement de données personnelles