Une Intelligence Artificielle envoie 5 champions de Poker au tapis en même temps

Laura Léger
Publié le 15 juillet 2019 à 11h24
humain et IA

Pluribus, c'est son nom, a réussi pour la première fois à battre 5 joueurs à la fois au Texas Hold'em no limit. Développé par Facebook et l'Université de Carnegie-Mellon à Pittsburgh en Pennsylvanie, cette intelligence artificielle réalise pour la première fois ce qu'aucune autre n'avait accompli jusqu'ici.

En 1997, et pour la toute première fois, une intelligence artificielle battait un champion du monde d'échecs... Depuis de l'eau a coulé sous les ponts puisqu'une IA a récemment réussi à vaincre cinq adversaires au Poker Texas Hold'em, faisant ainsi d'elle la première IA victorieuse dans un jeu multijoueurs.

Une configuration plutôt modeste

L'intelligence artificielle Pluribus s'est « formé » une stratégie globale en 8 jours de calcul sur un serveur doté de 64 cœurs et aura nécessité moins de 512 Go de RAM. C'est donc assez peu par rapport aux autres intelligence artificielles déployées ces dernières années pour battre des humains au jeux.

Là où Pluribus fait encore plus fort, c'est que celle-ci ne s'est pas entraînée contre un humain, mais simplement contre elle-même, encore et encore jusqu'à atteindre son meilleur niveau.

Une manière de jouer très personnelle

Seule, pendant une semaine, l'IA à pratiqué ce que ses programmeurs ont appelé le Monte Carlo counterfactual regret minimization. Le principe du Monte Carlo repose sur le fait de réfléchir toujours selon trois possibilités et de construire trois schémas des jeux possibles en prévision des coups à venir, un peu comme un arbre. Regret minimization, quant à lui, est le fait de prédire ce qui peut être joué et de mettre en place celui qui créera le moins de regrets une fois la décision prise.

L'IA a donc montré sa supériorité en évitant les erreurs que pourraient faire d'autres intelligences artificielles, car en un contre un, il est facile de connaître la main de l'adversaire, mais cela se complique lorsque quatre autres personnes sont à prendre en compte.

La plupart des IA sont ainsi battues en répétant finalement une habitude que l'adversaire humain pourrait repérer et mettre à son avantage. De la même façon, Pluribus est capable de changer de tactique en moins d'une minute, passant de la relance au bluff, la rendant ainsi illisible et imprévisible. C'est donc encore une victoire pour l'intelligence artificielle, reste à savoir quel sera le prochain défi que les chercheurs parviendront à lui faire relever.

Source: facebook Artificial Intelligence
Laura Léger
Par Laura Léger

Rédactrice et photographe passionnée. Accro à la pop-culture et à la lecture. Ma sensibilité à l'environnement me porte à croire que les technologies du futur sont une des solutions à de nombreux problèmes. En attendant, je passe mes soirées entre Netflix, les jeux vidéos et les jeux de sociétés, le tout accompagné toujours et à chaque instant de musique évidemment.

Vous êtes un utilisateur de Google Actualités ou de WhatsApp ?
Suivez-nous pour ne rien rater de l'actu tech !
Commentaires (0)
Rejoignez la communauté Clubic
Rejoignez la communauté des passionnés de nouvelles technologies. Venez partager votre passion et débattre de l’actualité avec nos membres qui s’entraident et partagent leur expertise quotidiennement.
Commentaires (5)
bipolaire

Une intelligence artificielle créée par des humains pour battre des humains dans un jeux créé par des humains… beaucoup de News de ce genre… je me demande où est la valeur ajoutée ?
Pas d’intelligence artificielle pour mettre tout le monde d’accord sur les raisons du changement climatique ?

chickenwing

“inlisible et imprévisible”.
Vraiment ? C’est inicroyable ça

llaura

C’est corrigé, merci à vous.

cirdan

:smile:
Autres problèmes orthographiques ou bizarreries:
“Développé(e) par Facebook”
" L’intelligence artificielle Pluribus s’est « formé(e) » une stratégie globale". Le fameux auto-formage?
“l’IA à pratiqué”
“trois schémas des jeux possibles”
“et de construire trois schémas des jeux possibles en prévision des coups à venir, un peu comme un arbre.” Un arbre très intelligent et joueur ?
" Regret minimization , quant à lui, est le fait de prédire ce qui peut être joué et de mettre en place celui qui créera le moins de regrets une fois la décision prise." Sinon il est triste ?

bipolaire

La plus grande puissance du monde n’y croit pas… le doute peux exister?

Abonnez-vous à notre newsletter !

Recevez un résumé quotidien de l'actu technologique.

Désinscrivez-vous via le lien de désinscription présent sur nos newsletters ou écrivez à : [email protected]. en savoir plus sur le traitement de données personnelles