AlphaGo Zero: La inteligencia artificial ya no necesita de los seres humanos


¡Sí, la IA ya no necesita de los humanos!

Bueno, al menos es así en los juegos de mesa virtuales. Se trata nuevamente de AlphaGo, el programa inteligente que en mayo venció al campeón mundial de go. La creación de Google DeepMind da un nuevo paso adelante al actualizarse en la versión AlphaGo Zero, capaz de mejorarse a si misma sin necesitar de entrenamientos con un jugadores reales.

Las versiones previas del sistema (AlphaGo Lee y AlphaGo Master), antes de enfrentarse a campeones de renombre, se perfeccionaron analizando más de treinta millones de partidas entre jugadores profesionales reales, lo que les permitió deducir movimientos ventajosos y crear estrategias propias para vencer.   

Sin embargo, a AlphaGo Zero se le proporcionó un nuevo algoritmo que le hizo posible aprender a ganar de la nada. No necesitó analizar ningún partido entre personas de carne y hueso ni entrenar con ningún profesional. Solo le bastó conocer las reglas del juego y practicar consigo mismo gracias a su sofisticada red neuronal.

De esta forma, el equipo detrás de DeepMind logró demostrar la eficacia que la inteligencia artificial puede lograr aun cuando no se cuentan con suficientes datos ni conocimientos, solo con principios básicos. Con el aprendizaje por refuerzo puro, la IA ya no busca superar a los humanos tomando sus capacidades como referencia, sino llegar a donde ellos no pueden ni imaginar.

Kanō Eitoku

AlphaGo es ahora su propio maestro. Con solo tres horas de práctica la IA ya dominaba el go al nivel de un principiante, lo que significa darlo todo sin pensar en el largo plazo; a las 19 horas, su nivel de juego mejoraba las estrategias con una visión de futuro; y con 70 horas, ya contaba con una pericia sobrehumana libre de toda flaqueza, controlando todas las posibilidades de juego a lo largo y ancho del tablero.  

En pocas palabras, en solo tres días AlphaGo Zero adquirió un nivel que varias generaciones de jugadores orgánicos no alcanzaron en miles de años. Finalmente ha quedado demostrado que una sola red neural es más poderosa que dos redes independientes, las cuales usaban las dos versiones anteriores para decidir y evaluar jugadas.

Al lograr un sistema capaz de perfeccionarse sin el estorbo de las limitadas capacidades humanas, el equipo de Google Deepmind resalta el enorme beneficio que esto traería más allá de los juegos. Gracias al aprendizaje por refuerzo puro, la IA podría encontrar soluciones en áreas en donde no existe un conocimiento humano especializado. 

Quizá este sea el primer paso que estamos dando hacia un futuro en donde la humanidad dependerá más de las maquinas que de sí misma. 

 Pinterest

Comentarios