DeepMind lança um novo sistema de IA capaz de jogar “Stratego”

A unidade DeepMind da Alphabet Inc. desenvolveu um novo sistema de inteligência artificial capaz de jogar “Stratego”, um jogo de tabuleiro considerado mais complexo que o xadrez e ir.

DeepMind detalhado o sistema de IA, que ele chama de DeepNash, na quinta-feira. A unidade Alphabet relata que o DeepNash alcançou uma taxa de vitórias de mais de 84% em partidas contra jogadores humanos experientes.

“Stratego” é um jogo de tabuleiro para dois jogadores que se assemelha ao xadrez em alguns aspectos. Os jogadores recebem uma coleção de peças do jogo que, como peças de xadrez, são manobradas pelo tabuleiro até que um dos jogadores vença. Mas há uma série de diferenças entre os dois jogos que tornam o “Stratego” mais complicado do que o xadrez.

Em “Stratego”, cada jogador tem apenas informações limitadas sobre as peças do jogo do outro jogador. Um jogador pode saber que o outro jogador colocou uma peça do jogo em uma determinada seção do tabuleiro, mas não qual peça específica do jogo foi colocada lá. Essa dinâmica torna o jogo difícil para sistemas de IA.

Outra fonte de complexidade é que há mais possibilidades a serem consideradas do que no xadrez. O número de táticas potenciais que os jogadores podem usar em um jogo de tabuleiro é medido com uma métrica conhecida como número de complexidade da árvore do jogo. O xadrez tem um número de complexidade da árvore do jogo de 10 elevado a 123, enquanto no “Stratego” esse número aumenta para 10 na potência de 535.

De acordo com a DeepMind, os métodos tradicionais de ensinar sistemas de IA a jogar jogos de tabuleiro não podem ser bem aplicados ao “Stratego” devido à sua complexidade. Para resolver essa limitação, os pesquisadores da DeepMind desenvolveram um novo método de IA chamado R-NaD, que se baseia no campo matemático da teoria dos jogos. Este método forma a base do sistema DeepNash DeepMind detalhado esta semana.

De acordo com a DeepMind, a DeepNash está desenvolvendo um plano para vencer partidas “Stratego” simulando o chamado equilíbrio de Nash. Um equilíbrio de Nash é uma situação em que cada jogador “Stratego” usa a estratégia de jogo com maior probabilidade de derrotar a estratégia do outro jogador. Em tal situação, ambos os jogadores executam a combinação ideal de jogadas de jogo durante a partida.

Ao estudar o que aconteceria se o oponente fizesse a combinação ideal de movimentos, o DeepNash pode desenvolver um plano de ação que maximize suas chances de vitória.

Para avaliar o desempenho do DeepNash, o DeepMind fez com que ele jogasse uma série de partidas contra vários sistemas de IA anteriores configurados para jogar “Stratego”. O DeepNash venceu mais de 97% das partidas, de acordo com a unidade Alphabet. Em outra análise, DeepNash jogou uma versão online de “Stratego” e alcançou uma taxa de vitória de 84% contra jogadores humanos experientes.

“Para alcançar esses resultados, o DeepNash demonstrou comportamentos notáveis ​​durante a fase inicial de implantação da moeda e na fase de jogo”, detalharam os pesquisadores do DeepMind em um comunicado. postagem no blog. “O DeepNash desenvolveu uma estratégia imprevisível. Isso significa criar implantações iniciais que sejam variadas o suficiente para evitar que seu oponente detecte padrões ao longo de uma série de jogadas.

A DeepMind acha que as técnicas de IA que desenvolveu para construir o DeepNash podem ser aplicadas a outras tarefas além de jogar “Stratego”. De acordo com a unidade da Alphabet, a capacidade do sistema de IA de desenvolver um curso de ação ideal em situações complexas pode ser aplicada em áreas como gerenciamento de tráfego.

“Também esperamos que o R-NaD possa ajudar a desbloquear novos aplicativos de IA em campos que tenham um grande número de participantes humanos ou de IA com diferentes objetivos que podem não ter informações sobre a intenção de outros ou sobre o que está acontecendo em seu ambiente”, detalhou os pesquisadores da DeepMind. .

Imagem: DeepMind

Mostre seu apoio à nossa missão juntando-se ao nosso Cube Club e à nossa comunidade de especialistas do Cube Event. Junte-se à comunidade que inclui o CEO da Amazon Web Services e Amazon.com, Andy Jassy, ​​o fundador e CEO da Dell Technologies, Michael Dell, o CEO da Intel, Pat Gelsinger, e muitos outros luminares e especialistas.