L’intelligence artificielle DeepMind bat à plates coutures des joueurs pros sur Starcraft II

Mathieu Grumiaux
Par Mathieu Grumiaux, Expert maison connectée.
Publié le 25 janvier 2019 à 20h39

AlphaStar, la déclinaison de l'IA DeepMind entraînée sur Starcraft II, a remporté 10 victoires de suite contre deux des meilleurs joueurs professionnels du titre. Elle a toutefois perdu la dernière partie.

Après le Go, les jeux vidéo. DeepMind, l'intelligence artificielle appartenant à Google, continue de progresser et ses développeurs ont souhaité la mettre à l'épreuve sur le célèbre jeu de stratégie Starcraft II.

Des sessions de 200 ans d'entrainement pour l'IA

Ils ont développé AlphaStar, un agent dérivé de DeepMind et entraîne spécifiquement pour jouer au titre de Blizzard. L'intelligence artificielle est partie de zéro et a commencé par l'apprentissage des règles en « regardant » pas moins de 3 500 matchs en 3 jours. Elle a pu également apprendre à imiter l'humain dans les techniques de jeu à utiliser.

Les développeurs ont ensuite créé une ligue AlphaStar, multipliant les intelligences artificielles pour les faire jouer entre elles et développer de nouveaux réflexes durant une semaine. Le nombre de parties jouées correspond à environ 200 années de Starcraft 2 pour un être humain.

Des victoires sans appel grâce à un grand sens tactique

Après cet apprentissage rapide, AlphaStar a été confronté à un joueur professionnel, TLO, qui s'est incliné 5-0. Pour sa défense, il a joué avec la race Protoss qu'il ne pratique pas lors de ses entraînements ou tournois. L'IA était par contre limitée dans ses temps de réaction (environ 300 ms) pour jouer à armes égales face à un joueur pro de Starcraft II.

AlphaStar s'est ensuite entraîné sept jours supplémentaires pour affronter MaNa, l'un des 10 meilleurs joueurs Protoss au monde. Là encore, victoire écrasante de l'intelligence artificielle, qui bénéficie d'avantages considérables par rapport à l'humain comme une précision parfaite à chaque clic sur une unité ainsi qu'une visibilité globale de la carte, là où le joueur est lui limité à son champ de vision.

DeepMind a alors modifié les paramètres d'AlphaStar pour réduire le champ de vision à une parie de la carte seulement. C'est en utilisant cet avantage (dont il n'était pas au courant) que MaNa a pu prendre l'ascendant dans la dernière partie, en adoptant une stratégie qui a troublé l'IA et l'a induite en erreur.

Source : Engadgete
Mathieu Grumiaux
Expert maison connectée
Vous êtes un utilisateur de Google Actualités ou de WhatsApp ?
Suivez-nous pour ne rien rater de l'actu tech !
Commentaires (0)
Rejoignez la communauté Clubic
Rejoignez la communauté des passionnés de nouvelles technologies. Venez partager votre passion et débattre de l’actualité avec nos membres qui s’entraident et partagent leur expertise quotidiennement.
Commentaires (10)
pinkfloyd

Donc rien d’impressionnant pour ce qu’on appelle encore par erreur “IA” au lieu de deep learning

Avantage de l’ordi : plus rapide, peu ‘regarder’ partout en même temps et déplacer des unités aux 4 coins de la cartes plus vite que n’importe quel humain.

Autant faire un duel entre celui qui calculera le plus vite jusqu’à 1 million… -_-

madforger

Effrayant de voir que l’on est plus con que les machines que l’on a construit…

notolik

Ce qui est impressionnant, c’est que ce joueur IA n’avait pas un APM de dingue, il était plutôt bas même.APM = action par minute, c’est à dire le point ou en général un ordinateur pulvérise un joueur humain.
En fait Alphastar était bridé sur ce point : sinon c’était plié en 3mn20.
Mais même avec un APM bridé au possible, le multitasking d’une machine est monstrueux. La partie ou l’IA grignotte à l’usure pendant 5 mn une armée d’immortelle avec des Stalkers éparpillés sur toute la carte est très révélateur.

AlphaStar est peut être très au point, mais ce que l’on a vu de ces match, c’est surtout une microgestion incroyable d’efficacité “qu’avec” 300 d’APM. Un truc de fou ou aucun clic n’est une erreur…

Mais cela produit des parties sans saveurs, sans suspens… C’est beaucoup trop mécanique.

Pas_de_Bol

Pour la visibilité globale de la carte, je suppose que c’est en scannant toute la zone en un temps très court.
Mais s’ils ont imposé un délai de 300ms pour chaque action, comment fait-il ?

Krypton_80

Terminator n’est plus très loin…

Nervantoss

Edit triple poste

Nervantoss

Edit double post

Nervantoss

C’est donc qu’il “triche”,. Si l’IA à la carte découverte tout le temps ça rend les choses beaucoup moins impressionnante, surtout si il a perdu une partie malgré ça.

nyxxx

Il n’avait pas la carte entièrement découverte. Il avait juste une vision globale de la partie déjà découverte de la carte. Il n’avait donc à déplacer son champ de vision pour voir ce qu’il se passait à l’autre bout de la carte et pour lancer des actions. Donc pas de déplacement de caméra en fait.

PsykotropyK

Ce n’est pas une erreur d’appeler le Deep Learning IA. Et justement si c’est très impressionnant car il ne s’agit pas ici de simplement copier des actions humaines mais bien de prendre des décisions et d’adapter ses actions à un environnement. Regarde toute la vidéo tu verra que c’est bluffant.

Abonnez-vous à notre newsletter !

Recevez un résumé quotidien de l'actu technologique.

Désinscrivez-vous via le lien de désinscription présent sur nos newsletters ou écrivez à : [email protected]. en savoir plus sur le traitement de données personnelles