La "victoire" des professionnels sur un programme de poker est statistiquement un match nul


Tuomas Sandholm, professeur d'informatique à l'Université Carnegie Mellon, développeur principal du programme informatique Claudico

Le 8 mai, un tournoi de poker inhabituel s'est terminé au cours duquel quatre des 10 meilleurs joueurs du Texas Hold'em ont été confrontés au programme informatique Claudico. Résultat du concours «Brains Vs. L'intelligence artificielle » s'est avérée en faveur des gens: ils avaient un bilan positif suite aux résultats de 20 000 distributions dans un jeu à double sens.

Cependant, la victoire réelle ne signifie pas que les gens sont en fait plus forts que l'IA au poker. Les experts dans le domaine de ces compétitions expliquent que les mains ont joué et que le résultat n'est pas suffisant pour déterminer formellement le vainqueur, de sorte que le résultat de facto était un «tirage statistique».

Quatre joueurs en direct ont gagné ensemble 732 713 dollars virtuels. Ainsi, à l'arrivée, Bjorn Li a gagné 529 033 $ contre le programme, Doug Polk a gagné 213 671 $, Dong Kim a gagné 70 491 $ et Jason Les a perdu 80 482 $.

Le jeu n'a pas été joué pour de l'argent réel, bien que les professionnels puissent se qualifier pour une partie du prize pool de 100 000 $ fourni par Rivers Casino et Microsoft Research. Le fonds a été distribué en fonction des résultats de leur performance.

Tuomas Sandholm, professeur d'informatique à l'Université Carnegie Mellon, développeur principal de Claudico, dit qu'ils n'ont jamais eu l'intention de créer un programme informatique qui serait le meilleur joueur du monde. Mais ils voulaient voir quel serait le résultat contre des joueurs du Top 10 mondial.

Le poker est désormais l'un des principaux tests pour les systèmes d'IA, car c'est un jeu avec des informations incomplètes. Les joueurs ne connaissent pas les cartes de l'adversaire et essaient de le tromper concernant la force de leur main avec certains tours. Battre une personne au poker n'est pas une fin en soi, mais seulement un résultat intermédiaire. À l'avenir, ces systèmes aideront à prendre des décisions dans des situations où tous les faits ne sont pas connus. Ils vous aideront dans la sécurité informatique, la gestion financière, la médecine, etc.

Claudico a pris les règles du poker pour l'échantillon (bien qu'il pourrait s'agir de règles d'un autre domaine) et a développé de nouveaux algorithmes travaillant sur les systèmes du centre de supercalculateurs Blacklight à Pittsburgh. Dans un jeu réel, certaines des actions du programme étaient extrêmement étranges et incompréhensibles pour les gens. Par exemple, un pari de 19 000 $ à une banque de 700 $. Ou de très petits taux à 10% de la banque. Cependant, qui dit que les gens doivent nécessairement comprendre les actions de l'intelligence artificielle?

Le résultat de 20 000 mains ne peut pas être considéré comme un résultat statistiquement significatif. Mais en juillet dernier, un autre programme de poker Tartanian7 a montré un résultat vraiment significatif sur le plan statistique après un match avec des professionnels du poker au tournoi annuel de poker de l'Association pour l'avancement de l'intelligence artificielle. Dans toutes les sessions de jeu sans exception, la victoire était au programme.

Sandholm ne doute pas que l'IA fera bientôt preuve d'une supériorité complète sur les meilleurs joueurs de poker professionnels.

All Articles