Esta complejidad es precisamente lo que hace que el GO sea algo difícil de jugar para los supercomputadores, y por lo tanto un reto irresistible para los investigadores del campo de la computación cognitiva. La supremacía de los ordenadores en competiciones hombre-máquina ya se dio en el encuentro entre Garry Kasparovy el ordenador Deep Blue de IBM al ajedrez en 1997. También cuando otro sistema de IBM, llamado Watson,  ganó a dos campeones del programa Jeopardy en 2011. Pero hasta la fecha, el GO era un terreno donde los supercomputadores jugaban como principiantes.

Los modelos machine learning tradicionales de computación cognitiva basados en la búsqueda en árbol sobre todas las posibles posiciones no sirve para el GO si tenemos en cuenta la magnitud del problema que acabamos de mencionar. Por ello, AlphaGo complementa esta opción con Deep Learning.

Sinceramente, no he entrado en detalle sobre cómo abordan el problema, pero la idea es que la entrada que usan para la red neuronal de su Deep Learning es una descripción del tablero de GO, y la red neuronal está formada por múltiples capas que contienen millones de conexiones entre sus neuronas. En realidad son más de una red neuronal las que usan, por lo que explica el equipo de DeepMind en su artículo publicado en la revista Nature.

Estas redes neuronales han sido entrenadas con millones de movimientos gracias a expertos humanos en el juego del GO como Fan Hui (lo que definimos como aprendizaje supervisado) y a la vez con lo que se conoce con Reinforce learning: a partir de juegos que ha realizado la máquina por si sola, va aprendiendo mediante un modelo de prueba y error, por decirlo de alguna manera. En ningún sitio he encontrado la potencia de cálculo usada, solo que han usado su Google Cloud Platform, pero sin duda habrá sido algo espectacular al alcance solo de Google y pocos más.

Pero aunque les parezca un contrasentido, en Google están saltando de alegría por haber perdido, porque esto en realidad les permitirá mejorar la máquina. ¡No lo duden!

 

ACTUALIZACIÓN 15/03/2016:  Resultado final AlphaGo 4 – 1 Lee Sedol. 

ACTUALIZACIÓN 21/03/2016: creación de la ilustración.