Libratus AI venceu os profissionais em Texas Hold'em sem limite

Nas cartas, é preciso saber quando se deve jogar uma mão e quando se deve dobrar. Quanto à superioridade humana no póquer, talvez seja altura de passar. Investigadores da Carnegie Mellon University colocaram as cartas na mesa, publicando um artigo na revista Science. No jornal, os cientistas explicaram como ensinaram o software do Libratus AI a bater os jogadores profissionais de hold'em sem limite. Outro nó de dominó parece ter caído numa série de experiências humanas versus máquinas - primeiro foram as damas e o xadrez, depois o antigo jogo de go.

O póquer é diferente destes jogos. Aqui o participante não sabe exactamente que cartas têm os seus adversários. Por conseguinte, existe uma lacuna sob a forma de blefe. Há muito que se acredita que um jogo baseado em informação incompleta seria muito difícil para a aprendizagem mecânica. O Professor Tuomas Sandholm e o candidato a doutor Noam Brown mostraram como isto pode ser feito.

A Libratus ganhou no final de um concurso de 20 dias com quatro profissionais de póquer, realizado no Rivers Casino, Pittsburgh. O software venceu cada jogador um a um em Head's-Up, No-Limit Texas Hold'em e levantou mais de 1,8 milhões de dólares em fichas, jogando 120.000 mãos. Disseram os investigadores:

"A tecnologia Libratus não utiliza conhecimentos especializados ou dados humanos, e não está fundamentada no póquer. O software é aplicável a uma vasta gama de jogos com informação incompleta".

E não apenas para jogos. Tomar decisões com base em informação incompleta é uma habilidade chave para os negócios, finanças, segurança cibernética e desenvolvimento de estratégia militar com tácticas.

Então, como é que os investigadores tiveram sucesso? Através de uma abordagem em três etapas. Em primeiro lugar, desenvolveram um algoritmo que simplificou as 1.021 decisões utilizadas num jogo de póquer típico. O algoritmo produziu um modelo para o jogo, detalhado para as primeiras rondas, mas mais geral para as rondas posteriores.

Disse Brown:

"Intuitivamente, não há muita diferença entre um flush com um rei e um flush com uma rainha. Se interpretar as duas mãos como idênticas, reduz a complexidade do jogo e torna os cálculos mais fáceis".

À medida que o jogo avança em direcção ao clímax, um segundo módulo é incluído, aperfeiçoando o padrão. Ele determina a estratégia em tempo real. Se o adversário fizer uma jogada inesperada, a estratégia é retrabalhada para dar conta da decisão do adversário. O terceiro módulo analisa o quanto o adversário está a apostar, e tenta assim encontrar lacunas na sua estratégia. Desta forma, o programa obtém mais informações para escolher.

O Libratus venceu programas semelhantes como o Baby Tartanian8, e depois ganhou de forma limpa contra Jason Les, Dong Kim, Daniel McCauley e Jimmy Chou. Este último comentou:

"O mais surpreendente é que o programa sabe como se adaptar. Está constantemente a aprender e a melhorar. Tem-nos testado para encontrar fraquezas. Deve regozijar-se com cada chip retirado das mãos do Libratus".

O engenheiro chefe acciano Alex Hanshaw brincou no Twitter:

"Não há necessidade de temer a guerra nuclear orquestrada pela IA. As máquinas apenas nos vão vencer a todos no póquer".

No entanto, o próprio Professor Sandholm acredita que as consequências são mais graves. Na sua opinião, as consequências dramáticas serão que o melhor software de IA é capaz de superar os humanos no pensamento estratégico baseado em informação incompleta. https://22bet-pt.org/ é a escolha para quem quer jogar em um cassino que oferece moeda local