AlphaZero, un programa informático de Google basado en redes neuronales, ha logrado derrotar a StockFish 8, uno de los motores de ajedrez más potentes del mundo. Para lograrlo, tan sólo ha necesitado conocer las reglas del juego y 4 horas de entrenamiento consigo mismo.
|
etiquetas: inteligencia artificial , ajedrez , redes neuronales , machine learning
Para los profanos del mundo del ajedrez, se puede explicar resumidamente, que el trabajo de bastantes años (unos 20 años aproximadamente del ajedrez informatizado moderno) entre humanos expertos y usando los más potentes ordenadores hasta ahora, ha sido superado notablemente por una inteligencia artificial que ha aprendido a jugar por si misma en tan sólo 4 horas. Han demostrado que una máquina puede aprender de si misma y mucho mejor sin que un humano le diga como.
Por lo que he leído, se han jugado 100 partidas a 1 minuto por movimiento, contra la que actualmente se considera mejor engine de ajedrez Stockfish 8 (las hay mejores, pero a fin de cuentas son mejoras mínimas del Stockfish) y bueno, el resultado final ha sido 28 victorias de AlfaZero y 62 tablas. Un resultado muy abultado para ser nueva.
Examinando ya las partidas que han publicado (10 partidas muy…...
Para los profanos del mundo del ajedrez, se puede explicar resumidamente, que el trabajo de bastantes años (unos 20 años aproximadamente del ajedrez informatizado moderno) entre humanos expertos y usando los más potentes ordenadores hasta ahora, ha sido superado notablemente por una inteligencia artificial que ha aprendido a jugar por si misma en tan sólo 4 horas. Han demostrado… » ver todo el comentario
De todas formas si es importante que una engine de ajedrez aprenda a sacrificar, y más si son sacrificios posicionales como hace esta. Porque era el punto de aquiles de las engines de ajedrez, ya que todas suelen hacer sacrificios tácticos y de sólo ataque en su mayoría.
Lo mejor es prepararse tranquilamente para el apocalipsis, como ya hacen los runners.
Los runners también pero no lo saben.
www.youtube.com/watch?v=g-Bt7AXlpqo
Y yo aquí con días enteros sin conseguir ningún hito.
No te puedo dar referencias pero sé que he leído varías noticias al respecto últimamente.
Me suena que hay más proyectos, pero nunca me quedo con el nombre, lo siento.
Creo que ese sería el problema.
PD: negativo por error cuando quería dar a responder
Me da igual lo potente que tenga que ser el hardware si en 4 horas aprendes a diagnosticar resonancias mejor que un profesional con años de estudio y experiencia, es aprender muy rápido
Meter las principales Inteligencias Artificiales en el mismo ordenador y que convivan y se relacionen, sólo puede quedar una
Me voy a forrar
news.ycombinator.com/item?id=15858197
www.reddit.com/r/chess/comments/7hvbaz/mastering_chess_and_shogi_by_se
www.reddit.com/r/MachineLearning/comments/7hvr19/r_mastering_chess_and
Pues a mí no me parece nada fascinante cuando las condiciones de juego no son las mismas dejando a StockFish sin toda su capacidad.
Lo hubieran entrenado más tiempo o mejorado aún más la IA para obtener un rotundo 100%, que no dudo acabarán logrando.
PD: Probablemente en 1 segundo haya jugado varios miles de partidas
"El resultado del match a 100 partidas (50 con cada color, a un ritmo de 1 minuto finish por jugada) fue de 64 a 36, saliendo AlphaZero totalmente invicto del encuentro." 100 partidas, en 4 horas
En general deberíamos empezar a tener cuidado con estas metáforas usadas por los ingenieros, porque IA no… » ver todo el comentario
Ahora que lo pienso, pobre Max Deutsch
en.chessbase.com/post/beating-magnus-after-a-month-of-training
Si lo que te da miedo son las implicaciones de hablar de las IA como si fuesen mentes... es que son mentes, con los matices que quieras pero mentes, no creo que falte tanto para que adquieran conciencia de sí mismas, si es que no lo están limitando ya para que no ocurra.
Conste que estoy cuñadeando.
" Lo que yo me pregunto es si pueden adquirir voluntad propia sin ser programados para buscar un objetivo"
Eso tendrá que ocurrir para dar respuestas mejores que las nuestras a los problemas, tendrá que buscar variables nuevas y su relevancia por propia voluntad con el fin último de resolver el problema, incluso de adelantarse a futuros problemas, no sé si me explico. Y eso posiblemente es el paso previo a la… » ver todo el comentario
La siguiente cuestion seria saber si llegaran a disfrutar de su "vida" igual que… » ver todo el comentario
Por ej. #50. ¿Conciencia? No tengo miedo de la informática, yo programo a nivel hoby, pero conciencia ninguna, eso todavía está lejisimo. Y si se consigue no parece que vaya a ser como la humana.
¿Lejísimos qué es? ¿Treinta, diez, cinco años? Lo que sí es muy loco es la velocidad a la que avanza esto porque el que controle las IA controlará el mundo.
El tema es cómo se llega a esa autoconsciencia y si nos conviene retrasarla como supongo que ya estarán previniendo.
La medicina utiliza nombres complicados para explicar conceptos sencillos. La informática utiliza nombres sencillos para conceptos complicados.
De hecho aprendió solo, solamente le dijeron las reglas del ajedrez.
Si es capaz de aprender diciéndole sólo las reglas crees que no podría aprender si cambiáramos una sola?
(claro que mientras el otro mueve, podría echarse varias rapiditas sin que se note e ir mejorando, ¿no?)
Gracias por el vídeo.
totalmente de acuerto
Por ejemplo, si la nueva regla es un cambio de la disposición inicial de las piezas, a alphazero se la sopla, mientras que a un jugador humano le machacas todo lo que ha estudiado sobre aperturas.
www.meneame.net/story/aun-queda-esperanza-hombre-derrota-maquina-jugan
www.independent.co.uk/life-style/gadgets-and-tech/news/ai-poker-win-to
Me parece que comparan algo así como churras con merinas, por comentar un detalle que salta a la vista sin leer el paper completo:
- Potencia de cálculo. Según he leído se le dió 1 minuto por movimiento. StockFish solo utiliza un hilo/núcleo y Deepmind utilizó otro hardware que llaman TPU ( Tensor Flow Unit ) que básicamente es un ASIC específico para IA, por lo que sin poder comparar potencia de computación ya es comparar cosas diferentes.
- En el paper habla de que AlphaZero "descubrió" las aperturas más jugadas por los humanos en la última década... No sé, es un paper corto, raro y que huele mal.
en.wikipedia.org/wiki/Tensor_processing_unit
Cualquier experto informático, como ya han escrito por arriba, te dirá que está sesgado. Es probable que AlphaZero siga siendo vencedor pero sin dar tanta ventaja al algoritmo de Stockfish que igualmente puede ser implementado en hardware.
De hecho, la bolsa está diseñada para los humanos, con sus incertidumbres y sus miedos, no para una IA con unos algoritmos supersofisticados.
Un algoritmo que prueba millones de combinaciones para eliminar virus. ¿No te parece una posiblidad fascinante?
El tema no es ajedrez, el tema es que la humanidad lleva un milenio "optimizando" un juego complejo, y esa IA en 4 horas ha llegado a un nivel parecido que la humanidad en un milenio. La clave aquí es extrapolar esa capacidad de aprender.
Ya hicieron algo similar con AlphaGo y los resultados fueron increibles. Os dejo este enlace porque no tiene desperdicio.
deepmind.com/blog/alphago-zero-learning-scratch/