L'intelligence artificielle se développe à une vitesse impressionnante. Il y a deux mois, Pluribus a marqué l'Histoire en battant cinq joueurs de poker à la fois. Au début de l'année, l'IA de Google, Deepmind a battu des joueurs professionnels à Starcraft II.
Cette fois-ci, c'est l'initiative d'OpenAI qui attire l'attention. L'IA américaine a prouvé sa capacité à apprendre en jouant en équipe à des parties de cache-cache.
De plus en plus fortes au cache-cache
On ne présentera pas le jeu du cache-cache. En revanche, lorsque ce jeu mondialement connu est présenté à une intelligence artificielle, celui-ci peut révéler comment cette dernière gère l'importance des décisions auxquelles elle est confrontée.OpenAI, qui est basée à San Francisco, a rendu open-source un environnement d'entraînement destiné aux IA. Cet environnement a déjà été utilisé, mettant en scène différents acteurs contrôlés par des IA. Ceux-ci ont eu pour objectif de se cacher et de se trouver, déployant des techniques de plus en plus sophistiquées pour y parvenir. On retrouve sur les images ci-dessous l'évolution de ces techniques : si, dans un premier temps, les IA ont pu se contenter de se cacher, elles ont par la suite improvisé des constructions et détourné l'utilisation d'objets. Et surtout, ces IA ont travaillé ensemble pour atteindre un but commun.
Bien sûr, l'intelligence artificielle aura dû jouer un (très) grand nombre de parties pour parfaire son apprentissage. Ce n'est qu'après 25 millions de « matches » que les IA impliquées ont commencé à bâtir des abris improvisés. Avec 75 millions de matches supplémentaires, les « chercheurs » ont eu l'idée d'utiliser boîtes et rampes pour sauter dans ces abris.
L'intérêt pour les travaux futurs
À terme, les IA impliquées ont réussi à élaborer des stratégies complexes dans un environnement qu'elles ne connaissaient pas a priori. Les chercheurs d'OpenAI expliquent ainsi : « Les succès rencontrés laissent penser que ces environnements pourraient permettre à des IA d'acquérir un nombre conséquent de... compétences. Ceci amène à un comportement centré sur des compétences beaucoup plus pertinentes pour l'être humain que d'autres méthodes d'apprentissage par renforcement ».En d'autres termes, et au-delà des environnements de jeu, ces tests montrent que l'IA peut apprendre à élaborer elle-même de nouvelles techniques utiles, par exemple, dans le diagnostic médical ou la découverte de structures de protéines complexes.
Lire aussi :
Des chercheurs ont mis en avant les faiblesses de l'IA en lui proposant des images confuses
Des chercheurs ont mis en avant les faiblesses de l'IA en lui proposant des images confuses
Dans une précédente interview, Demis Hassabis, le co-fondateur de l'IA Alphabet Deepmind, a déclaré auprès du site VentureBeat : « À terme, nous développerons des algorithmes qui peuvent être transposés dans le monde réel, pour travailler à des défis réellement difficiles... et aider les experts de ces secteurs ».
Source : Venture Beat