!! PARA PODER DESCARGAR DARLE A SEGUIR !!

!! TO BE ABLE TO DOWNLOAD IT !!


PLAY ONLINE CHESS - AJEDREZ ONLINE GRATIS - VER TORNEOS ONLINE - VIEW TOURNAMENT ONLINE

chess24.com your playground

ALPHA ZERO - se ha hecho HISTORIA... La Inteligencia Artificial REAL a Nacido y ha VENCIDO


ALPHA ZERO ha llegado señores. es decir SkyNet. Un Programa de Inteligencia Artificial REAL. Si... real, es decir, aprende por si mismo en base a reglas básicas en teoría podría aprender y mejorarse a si mismo de una forma INCREIBLE sobre cualquier esquema de inteligencia conocido. Ha llegado señores. SKYNET. Google a Creado a lo que sera el futuro impensable o de ciencia ficción. Alpha zero en solo 4 horas ha aprendido 2000 años de conocimiento ajedrecistico y le ha jugado al Campeón del mundo de las computadoras Stockfish. Jugaron 100 partidas. Alpha zero NO PERDIÓ NI UNA PARTIDA. y le gano 25 partidas a Stockfish y las demás quedaron empate. Es decir es UNA BESTIA APOCALÍPTICA DEL CALCULO NEURONAL SENCILLAMENTE ES INCREÍBLE. Ha llegado SkyNet. Google que miércoles estas haciendo???

Imagínense lo siguiente: explicamos las reglas del ajedrez a un sistema informático sin más. Después le damos la instrucción de que aprenda a jugar al ajedrez por si mismo. Un día más tarde (sí, correcto, únicamente 24 horas) nuestro compañero de silicio se lo sabe todo. Y encima es capaz de derrotar a los módulos de ajedrez más fuertes del mundo. DeepMind, la empresa que hace poco también creó el programa más fuerte del mundo de go ahora ha dirigido su atención al ajedrez y ha anunciado un resultado alucinante. El protagonista se llama AlphaZero. 





DeepMind y AlphaZero
DeepMind, una empresa relacionada con Google, hace poco había creado un programa muy fuerte de "go". Ahora ha desarrollado una "bestia de ajedrez" con inteligencia artificial cuyo nombre es AlphaZero. En su momento, al programa de go le habían enseñado miles de partidas magistrales y así la máquina aprendió a jugar.

En el caso de AlphaZero, no le enseñaron ni una sola partida de ajedrez. Lo único que le explicaron fueron las reglas de juego, nada mäas. El resultado llegó como un choque. El programa de go, AlphaGo había aprendido a jugar en tres días. Ahora, AlphaZero aprendió a jugar al ajedrez en un solo día.

Ha habido varias máquinas que han obtenido resultados impresionantes en el mundo del ajedrez. Hace 20 años, por ejemplo, Deep Blue venció a Garry Kasparov. Hoy en día hasta los teléfonos inteligentes de cierta calidad son capaces de derrotar al mejor jugador de ajedrez del mundo. O sea que, ¿qué más queda por demostrar?

Profesor David Silver explicando como AlphaZero ha sido capaz de aprender a jugar mucho más rápido cuando se enseñó todas las cosas a si mismo. El factor más importante en todo aquello era la eficacia del algoritmo principal.

Un nuevo paradigma

El 5 de diciembre 2017, el grupo DeepMind publicó un nuevo informe en la web de la Universidad de Cornell con el título "Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm", (el autoaprendizaje del ajedrez y del shogi con un algoritmo generalmente reinforzado de aprendizaje).

AlphaZero no solamente aprendió a jugar al ajedrez por su cuenta, sino al día siguiente ya era capaz de derrotar a uno de los mejores módulos de ajedrez. AlphaZero venció a Stockfish (en su versión más potente) por 64:36. Es más: AlphaZero no perdió ni una sola partida (sumó 28 victorias y empató en 72 partidas).

Stockfish será un programa conocido entre los lectores de la web de ChessBase. Durante el duelo, corrió en un ordenador 900 veces más rápido que el que utilizaba AlphaZero. Este último calculaba unas 80.000 posiciones por segundo, mientras que Stockfish, funcionaba en un ordenador normal con 64 threads (probablemente en una máquina con 32-cores) calculaba unos 70.000.000 posiciones por segundo. A pesar de esa desventaja tremenda, AlphaZero fue capaz de aplastar a Stockfish por ese marcador tan impresionante de 64:36.

¿Cómo es posible?

El informe "Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm" en la Universidad de Cornell

El informe explica:

“AlphaZero compensa la cantidad inferior de evaluaciones, sirviéndose de una red artificial de neuronas para calcular de manera mucho más selectiva que los módulos normales. Presta atención únicamente a aquellas variantes que parezcan ser las más prometedoras. Es decir, trabaja de una manera que se parece al enfoque humano, tal y como lo había sugerido originalmente Shannon.

El gráfico indica cuánto tiempo necesitaba qué programa para reflexionar los movimientos en relación con una valoración "relativa" de Elo. Resulta que Stockfish o Elmo necesitan unos 40 milisegundos por movimiento.  La valoración de AlphaZero resultó ser mucho más eficiente en comparación con el tiempo de reflexión que requerían Stockfish o Elmo. Eso pone en duda la teoría de que la búsqueda alfa-beta era inherentemente superior en este tipo de cálculos".

En otras palabras: el cálculo selectivo (solamente calcular las variante razonables) es mucho más eficiente que el cálculo a bruta fuerza (cuanto más variantes, mejor).

¿Cómo juega AlphaZero?

Dado el caso que AlphaZero no tenía la posibilidad de aprovecharse de conocimientos previos ni de experiencias ajedrecísticas algunas, hay que constatar que ha descubierto la teoría de aperturas relevante por su propia cuenta. Y no nos olvidemos que haya obtenido ese brillante resultado tras tan solo 24 horas de aprendizaje.

El equipo de investigadores poia ver como AlphaZero iba descubriendo las aperturas y como a continuación las iba descartando de una en una si no le parecían útiles. 

Professor David Silver, explicando como AlphaZero aprendió las aperturas en el juego de go y como las iba descartando poco a poco y mejorando su juego gradualmente. Lo mismo ocurrió en ajedrez

En el diagrama arriba podemos ver las partidas que jugó AlphaZero al comienzo del aprendizaje. En un primer lugar le solía gustar  bastante la Defensa Francesa. Pero dos horas más tarde (y qué humilliante es eso), ya comenzó a jugarla cada vez menos porque ya no le convencía y había otras aperturas que le parecían más útiles.

La Caro-Kann aguantaba durante más tiempo como "variante favorita" de AlphaZero. Pero, poco a poco también decidó a descartar esa variante. Entonces le llegaron a gustar más la Apertura Inglesa y el Gambito de Dama.

El informe incluía también diez partidas para acompañar los resultados. Hay que reconocer que son partidas bastante diferentes a las partidas habituales jugadas por los módulos de ajedrez. Si Karpov hubiese sido un módulo de ajedrez, igual su nombre habría sido AlphaZero. AlphaZero Juega en plan "boa constrictor" y no tiene compasión.

Los módulos modernos suelen centrarse sobre todo en factores como la actividad. Tienen incorporados ciertos sistema de seguridad para evitar posiciones bloqueadas porque esas no las llegan a comprender muy bien en muchos casos.

No así AlphaZero. Ese sí que juega sin miedo y sin prejuicios algunos. Parece que está espiando el juego del oponente para entonces torcerle el cuello justamente aprovechándose de los conocimientos obtenidos sobre la marcha. Es francamente impresionante como juega AlphaZero. Incluso es capaz de encontrar aquellos giros tácticos que los demás módulos no son capaces de ver.
Related Posts Plugin for WordPress, Blogger...