AlphaStar, la déclinaison de l'IA DeepMind entraînée sur Starcraft II, a remporté 10 victoires de suite contre deux des meilleurs joueurs professionnels du titre. Elle a toutefois perdu la dernière partie.
Après le Go, les jeux vidéo. DeepMind, l'intelligence artificielle appartenant à Google, continue de progresser et ses développeurs ont souhaité la mettre à l'épreuve sur le célèbre jeu de stratégie Starcraft II.
Des sessions de 200 ans d'entrainement pour l'IA
Ils ont développé AlphaStar, un agent dérivé de DeepMind et entraîne spécifiquement pour jouer au titre de Blizzard. L'intelligence artificielle est partie de zéro et a commencé par l'apprentissage des règles en « regardant » pas moins de 3 500 matchs en 3 jours. Elle a pu également apprendre à imiter l'humain dans les techniques de jeu à utiliser.Les développeurs ont ensuite créé une ligue AlphaStar, multipliant les intelligences artificielles pour les faire jouer entre elles et développer de nouveaux réflexes durant une semaine. Le nombre de parties jouées correspond à environ 200 années de Starcraft 2 pour un être humain.
Des victoires sans appel grâce à un grand sens tactique
Après cet apprentissage rapide, AlphaStar a été confronté à un joueur professionnel, TLO, qui s'est incliné 5-0. Pour sa défense, il a joué avec la race Protoss qu'il ne pratique pas lors de ses entraînements ou tournois. L'IA était par contre limitée dans ses temps de réaction (environ 300 ms) pour jouer à armes égales face à un joueur pro de Starcraft II.AlphaStar s'est ensuite entraîné sept jours supplémentaires pour affronter MaNa, l'un des 10 meilleurs joueurs Protoss au monde. Là encore, victoire écrasante de l'intelligence artificielle, qui bénéficie d'avantages considérables par rapport à l'humain comme une précision parfaite à chaque clic sur une unité ainsi qu'une visibilité globale de la carte, là où le joueur est lui limité à son champ de vision.
DeepMind a alors modifié les paramètres d'AlphaStar pour réduire le champ de vision à une parie de la carte seulement. C'est en utilisant cet avantage (dont il n'était pas au courant) que MaNa a pu prendre l'ascendant dans la dernière partie, en adoptant une stratégie qui a troublé l'IA et l'a induite en erreur.
Source : Engadgete