IA domina humanos no jogo de guerra Stratego – pronta para guerra real?

Compartilhe este artigo com a galáxia!
Tempo de leitura: 4 min.
Ouça este artigo...

O ano de 2022 marca o 50º aniversário da estreia de Pong – um dos primeiros jogos de computador e o primeiro a se tornar um sucesso mundial como fliperama e videogame doméstico. Por causa do sucesso do Pong, os videogames proliferaram, mas a maioria das pessoas via os computadores dentro deles como plataformas ou alternativas aos tabuleiros, em vez de concorrentes. Isso mudou quando programas foram desenvolvidos para jogar contra oponentes humanos.

O sucesso foi lento para os computadores, especialmente nos antigos jogos de tabuleiro estratégicos de guerra, como xadrez e Go, ou em jogos de blefe como o pôquer. No entanto, os computadores eventualmente os dominaram e derrotaram seus mestres. Agora, outro jogo de estratégia bélica tradicional sucumbiu a um computador. É realmente uma notícia triste e possivelmente distópica porque o jogo é aquele que tem ‘estratégia’ embutido em seu nome – Stratego … um jogo considerado mais complexo que o Go.

É hora de admitir a derrota para os computadores e entregar a estratégia de guerra para a inteligência artificial?

Stratego era um dos poucos jogos de tabuleiro icônicos que a inteligência artificial (IA) ainda não havia dominado. É um jogo caracterizado por um desafio duplo: requer pensamento estratégico de longo prazo, como no xadrez, mas também requer lidar com informações imperfeitas, como no pôquer.”

Em um novo artigo publicado na revista Science, o pessoal da subsidiária de inteligência artificial da Goggle, DeepMind, revelou o DeepNash, um sistema de inteligência artificial para jogos projetado especificamente para jogar e vencer no Stratego, o clássico jogo de tabuleiro que a DeepMind descreve como sendo mais complexo do que xadrez e Go , e “mais habilidoso” que o pôquer. A parte “astuta” vem do fato de que, assim como o pôquer, o Stratego é um jogo de “informação imperfeita” onde os jogadores não podem observar diretamente as identidades das peças do oponente (ou cartas, no caso do pôquer).

“Este é Stratego – não um lugar, não um tempo, mas uma batalha de inteligência, habilidade e estratégia.” (De um comercial de 1983)

Stratego é um jogo de estratégia para dois jogadores em um tabuleiro de 10 × 10 quadrados. Cada jogador tem 40 peças que representam as patentes individuais de oficiais e soldados em um exército – mas as peças são verticais, então as insígnias são visíveis apenas para o jogador que as move. O jogo é uma forma do clássico “Capture de Flag” (‘Captura a Bandeira’) – o objetivo é encontrar e capturar a bandeira do adversário, ou capturar, isolar e cercar suas peças para que não possam fazer nenhum movimento. O jogo Stratego original pode ter sido baseado no tradicional xadrez militar japonês, mas a forma mais antiga mais semelhante à versão moderna foi o jogo francês L’attaque, patenteado em 1909 e jogado principalmente na França e na Grã-Bretanha.

A versão americana do Stratego foi criada pelo holandês Jacques Johan Mogendorff e registrada como marca em 1942 (há 80 anos neste ano) pela empresa holandesa Van Perlstein & Roeper Bosch N.V., que coincidentemente também produziu a primeira edição do Banco Imobiliario. O jogo foi sublicenciado para Milton Bradley, que foi adquirido pela Hasbro em 1984. O Electronic Stratego foi lançado há 40 anos, em 1982, mas a “eletrônica” limitava-se a acender luzes e tocar música e efeitos sonoros. O tradicional jogo de tabuleiro não eletrônico para dois jogadores (estão disponíveis versões para três e quatro jogadores) permaneceu basicamente inalterado.

“As abordagens de aprendizado de máquina que funcionam tão bem em jogos de informação perfeitos, como o AlphaZero da DeepMind, não são facilmente transferidas para o Stratego. A necessidade de tomar decisões com informações imperfeitas e o potencial para blefar tornam o Stratego mais parecido com o pôquer Texas Hold’em e requer uma capacidade semelhante à humana, uma vez notada pelo escritor americano Jack London: ‘A vida nem sempre é uma questão de segurar boas cartas, mas às vezes, jogando bem uma mão ruim.’

O site DeepMind.com explica o desafio enfrentado pelos desenvolvedores na criação de um programa para jogar Stratego em nível humano. Os jogos de blefe são inerentemente difíceis para computadores que dependem de dados confiáveis ​​para processar. Os jogadores do Stratego têm “informações imperfeitas” em seu banco de dados, portanto, devem equilibrar todos os resultados possíveis ao tomarem uma decisão. Esse é um grande desafio no pôquer Texas Hold’em, que termina após algumas decisões, mas quase intransponível no Stratego, que pode ter centenas de jogadas ao longo de horas de jogo sem pistas visíveis de como cada jogada pode afetar o resultado final.

Para computadorizar o xadrez e o Go, os programas recebem todos os estados possíveis do jogo e seus relacionamentos – uma estrutura conhecida como “árvore do jogo”. O site da DeepMInd diz que a “complexidade da árvore do jogo” do Stratego está “fora do gráfico” em comparação com xadrez, Go e pôquer. Depois de anos tentando e falhando com estratégias tradicionais e cada vez mais potência de computador, a DeepMind voltou-se para uma nova abordagem.

“A técnica que sustenta o DeepNash usa um método de aprendizado de reforço profundo sem modelo e teórico de jogos, sem pesquisa, que aprende a dominar o Stratego por meio do autojogo do zero.”

DeepNash (nomeado para o equilíbrio de Nash: um estado estável de um sistema envolvendo a interação de diferentes participantes, no qual nenhum participante pode ganhar por uma mudança unilateral de estratégia se as estratégias dos outros permanecerem inalteradas) descarta a abordagem de busca da árvore do jogo para um novo ideia algorítmica da teoria do jogo chamada Regularized Nash Dynamics (R-NaD), que direciona o aprendizado de IA do DeepNash para o equilíbrio de Nash (explicado no trabalho de pesquisa). Alerta de spoiler… funcionou. O DeepNash superou os métodos de IA de última geração existentes no Stratego e alcançou a classificação acumulada no ano (2022) e a classificação dos três primeiros de todos os tempos na plataforma de jogos Gravon, enquanto competia com jogadores humanos especializados. (Um jogo completo pode ser visto aqui.) O ex-campeão mundial do Stratego e coautor do artigo, Vincent de Boer, ficou impressionado.

“O nível de jogo do DeepNash me surpreendeu. Eu nunca tinha visto uma máquina capaz de jogar Stratego como um jogador humano experiente. Depois de jogar contra o DeepNash eu mesmo, não fiquei surpreso por ele ter ficado entre os três primeiros do ranking Gravon. Acho que ele se daria muito bem se o deixassem participar do Campeonato Mundial.”

DeepNash aprendeu uma variedade de táticas de blefe e isca – habilidades que levam o jogo de computador a um nível muito além de qualquer coisa imaginada pelos desenvolvedores de Pong há apenas 50 anos. E ainda, no nível básico, os jogos são os mesmos – combate entre dois jogadores.

Se o DeepNash pode derrotar um “general” humano em um jogo de estratégia de guerra, ele está pronto para substituir generais em salas de guerra reais? Este general de IA pode comandar soldados robóticos de IA para o sucesso em um campo de batalha militar tradicional contra soldados humanos? Queremos que Google seja tão geral?

Queremos mesmo descobrir isso?

Paul Seaburn

(Fonte)



Apoie o OVNI Hoje: Cada Doação é Essencial para continuidade deste site!

Agradecimentos aos colaboradores do mês:  ❤️Helio dos Santos Jr ❤️Silas Raposo ❤️Edward Vaz ❤️Cris Vilas Boas ❤️Leopoldo Della Rocca


ÁREA DE COMENTÁRIOS

Todos são bem-vindos a participar da área de comentários abaixo. Contudo, os comentários são de responsabilidade única e exclusiva de seus próprios autores. Ou seja, o site OVNI Hoje não se responsabiliza por quaisquer inconveniências ou conflitos por eles causados.

Importante: Antes de comentar, atente-se às regras da Área de Comentários e evite ser banido. As regras podem ser acessadas clicando aqui.

guerrainteligência artificialOVNI HojeStratego
Comentários não são disponíveis na versão AMP do site. (0)
Clique aqui para abrir versão normal do artigo e poder comentar.