Inicio
Juegos
Tecnología
Inteligencia artificial vence a humanos en juego de mesa stratego
martes, diciembre 13, 2022

Inteligencia artificial vence a humanos en juego de mesa stratego

Inteligencia artificial derrota a jugadores de juego de mesa stratego

Un sistema de inteligencia artificial de la empresa británica DeepMind ha aprendido a engañar y derrotar a oponentes humanos en el juego de mesa Stratego, un juego con un número inimaginablemente alto de escenarios posibles.

Un sistema de inteligencia artificial (IA) ha derrotado a jugadores humanos expertos en el juego de mesa Stratego. Ese juego de mesa basado en la guerra tiene más escenarios de juego posibles que el ajedrez, el go o el póquer.

Desarrollado por la empresa británica DeepMind, se convirtió en uno de los jugadores en línea mejor clasificados de la versión napoleónica de Stratego. Lo hizo en parte faroleando con piezas más débiles y sacrificando piezas clave cuando fue necesario.

“Para nosotros, el comportamiento más sorprendente de la IA fue su capacidad de sacrificar piezas valiosas para obtener información sobre la configuración y la estrategia del oponente”, afirma Julien Perolat, investigador de DeepMind.

10 535 situaciones de juego

En Stratego, dos jugadores intentan capturar la bandera del oponente, que está escondida en algún lugar entre las 40 piezas de juego. La mayoría de las piezas son soldados, numerados del uno al diez. Cuando dos soldados se encuentran en el tablero, el soldado con mayor rango derrota al de menor rango (excepto el espía, que puede derrotar al mariscal).

Mientras las piezas no se hayan encontrado todavía, los jugadores no pueden ver la identidad de las piezas del adversario. Esto diferencia a Stratego de juegos como el ajedrez o el go, en los que ambos jugadores pueden ver toda la información disponible desde el principio.

Lo que hace que Stratego sea aún más complicado es que existen nada menos que 10 535 situaciones de juego posibles. En comparación, el go tiene 10 360 situaciones de juego posibles, y el ajedrez y el póquer aún menos.

Estrategia óptima

Perolat y sus colegas de DeepMind llamaron a su IA DeepNash. Enseñaron al sistema Stratego dejándole jugar contra sí mismo 5500 millones de veces. El tiempo de entrenamiento simulado correspondía aproximadamente a un par de siglos jugando al Stratego. La IA no conocía en absoluto las estrategias humanas existentes. Tampoco se entrenó el sistema para jugar contra oponentes específicos.

Llevaría demasiado tiempo de cálculo pasar por todos los posibles escenarios de juego en el entrenamiento. En su lugar, DeepNash cuenta con un algoritmo que orienta constantemente su comportamiento hacia una estrategia óptima basada en la teoría de juegos, explica Karl Tuyls, investigador de DeepMind. Esa estrategia óptima garantiza al menos una victoria del 50 % contra un oponente que juegue sin errores, incluso si ese oponente sabe exactamente lo que trama la IA.

“El resultado es que una IA puede tomar decisiones ganadoras a pesar de tener información oculta sobre las posiciones de los oponentes, un enorme número de posibles estados de juego y numerosas opciones posibles para cada turno. Esto es algo que antes no podíamos hacer”, afirma Julian Togelius, investigador de IA de la Universidad de Nueva York.

Mundial de Stratego para ordenadores

DeepNash ha vencido a oponentes tanto humanos como controlados por ordenador. En 50 partidas en una plataforma de juego en línea contra jugadores humanos expertos, el sistema logró un porcentaje de victorias del 84 %. Esto la situó entre las tres primeras. Los oponentes humanos no sabían que estaban jugando contra una IA.

Además, la IA logró un 97 % de victorias contra varios jugadores informáticos. Entre ellos había varios que habían ganado anteriormente el Campeonato Mundial de Stratego para ordenadores.

“Los buenos jugadores son capaces de memorizar las piezas de su adversario y predecir cómo se moverán”, afirma Georgios Yannakakis, investigador de juegos de ordenador de la Universidad de Malta. “DeepNash hace bien ambas cosas, gracias en parte a una ventaja competitiva en memoria. Juega de forma interesante e imprevisible.

Sin comentarios