Una IA aprendió a jugar el clásico Pokémon Rojo y cayó en la estafa de Magikarp 10.000 veces

Las inteligencias artificiales están en todas partes, desde asistentes virtuales hasta sistemas complejos que debaten entre la ética y el futuro de la humanidad. Pero, ¿qué pasa cuando una IA se enfrenta a un videojuego clásico como Pokémon Rojo? Peter Whidden decidió averiguarlo y entrenó una IA para que completara el mítico juego. El resultado fue… inesperado, por decir lo menos.

Whidden sometió a la IA a un riguroso entrenamiento de 50.000 horas, en las que el algoritmo intentó aprender a jugar al clásico título de Game Freak. El método de aprendizaje automático permitió que la IA tomara decisiones basadas en las imágenes del juego y estableciera estrategias para avanzar. Sin embargo, lo curioso es que el viaje hacia la maestría en Pokémon se convirtió en una lección más sobre la naturaleza humana que sobre la IA misma.

MIRA: Cuatro mil ataques de contraseñas por segundo en el mundo: cómo el mal uso de la inteligencia artificial impulsa el auge de los ciberataques

Aprender a ser un entrenador Pokémon… a prueba y error

El objetivo era simple: que la IA pudiera completar Pokémon Rojo. Para guiarla, se diseñó un sistema de recompensas. Capturar un Pokémon daba un punto, ganar una batalla sumaba tres, y vencer a un Gimnasio añadía cinco. No obstante, la IA comenzó su aventura sin saber realmente qué hacer, guiándose solo por su curiosidad al observar las imágenes cambiantes del juego.

Al principio, la IA quedó atrapada en Pueblo Paleta, fascinada por los personajes que caminaban por allí. Estos cambios constantes en la escena confundían a la IA, que interpretaba la situación como una novedad digna de explorar. Esta distracción refleja, según Whidden, nuestra propia tendencia humana a la curiosidad y cómo muchas veces nos distraemos con lo que nos parece nuevo, aunque no nos lleve a ninguna parte.

Los obstáculos del mundo Pokémon

Tras algunos ajustes, la IA logró salir de Pueblo Paleta y llegar a Ciudad Verde, pero aquí surgió otro problema. Al enfrentarse a los combates, la IA prefería huir. La razón era simple: no obtenía recompensas por ganar las batallas. Para solucionarlo, Whidden modificó el sistema de puntuación, recompensando los niveles altos de los Pokémon y penalizando las derrotas. A partir de ahí, la IA comenzó a luchar y a capturar criaturas, incluso aprendió a permitir la evolución de sus Pokémon.

Sin embargo, a pesar de estos avances, la IA se negó a visitar los Centros Pokémon. ¿La razón? En una sesión, la IA, por error, depositó todos sus Pokémon en el PC del Centro, resultando en una enorme pérdida de puntos. Esta experiencia traumática quedó registrada en su “memoria”, y desde entonces evitó entrar a los Centros Pokémon a toda costa. Fue necesario ajustar nuevamente el sistema de recompensas para animarla a visitarlos.

La obsesión con Magikarp

Pero lo más sorprendente llegó cuando la IA llegó al Centro Pokémon antes del Monte Moon. Allí, se encontró con el vendedor que ofrece un Magikarp por 500 Pokécuartos. Para la IA, el Magikarp era una gran oportunidad: tenía cinco niveles más que sus otros Pokémon, así que lo compró. No una, ni dos, sino más de 10.000 veces en las pruebas realizadas. La IA no comprendió que estaba siendo “estafada”, sino que se centró en el simple hecho de aumentar sus niveles.

Este comportamiento es un reflejo de nuestros propios hábitos. Así como la IA insistía en comprar Magikarp para aumentar su poder, los humanos también tienden a repetir acciones que parecen beneficiosas a corto plazo, incluso si son perjudiciales a largo plazo, como consumir comida rápida.

MIRA: El CEO de Nvidia revela que tiene un tutor de IA y piensa que todos deberían tener uno

El final del camino

A pesar de todos los ajustes, la IA se encontró con un callejón sin salida en el Monte Moon. El pasillo era demasiado uniforme, y la IA no podía obtener ninguna recompensa de exploración. Después de 50.000 horas de intentos, no pudo avanzar más allá de esa cueva oscura. Sin embargo, Whidden descubrió patrones interesantes: la IA tendía a explorar en el sentido contrario a las agujas del reloj y siempre por las esquinas.

Curiosamente, también aprendió a capturar Pokémon con un solo lanzamiento de Pokéball, replicando un truco conocido entre los jugadores como “RNG Abuse”. Un logro impresionante que la IA desarrolló por sí misma sin ayuda.

Al final, el experimento no solo mostró los límites actuales de las IA en videojuegos, sino que también nos dio una oportunidad para reflexionar. Como dice Whidden, la IA es un espejo de nuestras propias decisiones y comportamientos. Y, aunque la aventura de esta inteligencia artificial llegó a su fin, su viaje nos deja con la pregunta: ¿cuántas veces, como ella, insistimos en comprar nuestro propio “Magikarp”?

Tendencias

CADE 2024 EN VIVO: programa, exposiciones y detalles del foro empresarial en Arequipa

Sector de transportistas evalúan nuevo paro nacional y posibles movilizaciones ante la ola de criminalidad

Atlético Madrid vs. Sparta Praga en vivo, Champions League: a qué hora juegan y en qué canal televisan

Aprender a ser un entrenador Pokémon… a prueba y error

Los obstáculos del mundo Pokémon

La obsesión con Magikarp

El final del camino

Los riesgos del Black Friday: cuidado con los cupones falsos, descuentos y las promociones ‘flash’

Recrean la Estación Científica Antártica “Machu Picchu” en Minecraft

Cuatro políticas eliminarían casi toda la contaminación por plásticos, según un estudio desarrollado con IA

Assassin’s Creed Valhalla y Star Wars Outlaws bloqueados por nueva actualización de Windows 11

Qué son los “1.000 días de oro” que pueden marcar la diferencia entre una buena y mala salud bucal

Invierno nuclear: el libro en el que Carl Sagan advierte sobre el uso de armas nucleares en una guerra

OpenAI actualiza GPT-4o: escritura más natural y mayor profunidad al trabajar con archivos cargados

PlayStation trabaja en una nueva consola portátil para competir con Nintedo Switch

Científicos desarrollan un plástico que se descompone en el agua del mar para reducir la contaminación

Tendencias

Una IA aprendió a jugar el clásico Pokémon Rojo y cayó en la estafa de Magikarp 10.000 veces

Aprender a ser un entrenador Pokémon… a prueba y error

Los obstáculos del mundo Pokémon

La obsesión con Magikarp

El final del camino

Artículos Similares