Escudo de la República de Colombia

Ciencia & Tecnología

IA aprende más rápido un videojuego con niveles graduales de dificultad

Un jugador controlado con inteligencia artificial (IA) al que se le va incrementando la dificultad en cada videojuego aprende más rápido que cuando se trata de enseñarle con el máximo nivel de dificultad desde el inicio.

Bogotá D. C., 23 de noviembre de 2020Agencia de Noticias UN-

La IA se usa en sistemas robóticos que operan plantas de producción o detección de fraude en operaciones bancarias.

LA IA puede aprender más rápido a jugar un videojuego si se usan currículos de aprendizaje durante su entrenamiento.

Los currículos que tuvieron el mejor desempeño redujeron el tiempo de entrenamiento desde un 15 % hasta un 40%.

El magíster Sáenz diseñó 24 currículos, cada uno variando diferentes parámetros del partido a distintas velocidades.

Los resultados obtenidos también se podrían aplicar a otros ámbitos como la robótica, la ciberseguridad y la conducción autónoma.

Así lo determinó una investigación reciente que muestra cómo el aprendizaje por currículos, o métodos, puede reducir el tiempo de aprendizaje de un agente inteligente –que en esencia es un algoritmo de IA diseñado para ejecutar una tarea específica– en un videojuego.

En el estudio, realizado por Rigoberto Sáenz Imbacuán, magíster en Ingeniería de Sistemas y Computación de la Universidad Nacional de Colombia (UNAL), con la dirección del profesor Jorge Eliécer Camargo Mendoza, doctor en la misma área, se plantea cómo un agente inteligente potencialmente puede aprender más rápido a jugar un videojuego si se usan currículos de aprendizaje durante su entrenamiento. Estos currículos son un conjunto de parámetros que determinan como varía la dificultad del juego en el tiempo.

En los experimentos entrenaron al agente para que aprendiera un videojuego de minifútbol de dos jugadores usando un currículo en particular, durante 100 millones de partidos que fueron simulados usando el motor de videojuegos Unity.

En los currículos de mejor desempeño, el agente aprendió de manera óptima solo con 60 o 70 millones de partidos. En cada uno, el agente inteligente, representado como un cubo azul en el videojuego, competía con un adversario rojo; el campo de fútbol tenía barreras que evitaban que la pelota saliera del campo y facilitaba el entrenamiento.

El agente podía ver su entorno mediante rayos de detección lanzados continuamente en diferentes direcciones y que detectan todos los elementos presentes en el campo, incluyendo los adversarios, el balón, las barreras y los arcos.

El investigador diseñó 24 currículos variando en cada uno parámetros del partido a distintas velocidades, con el fin de determinar cuáles tenían mejor efecto en los tiempos de entrenamiento.

Cada currículo se puede interpretar como distintas formas de darle una ventaja al jugador. “Al inicio de un partido, para guiar el proceso de aprendizaje del jugador, puedo reducir la velocidad de movimiento de los adversarios dándole una ventaja significativa y permitiéndole aprender rápidamente a perseguir la pelota y empujarla al arco contrario. Cuando aprende a marcar goles aumento la velocidad de los adversarios, con el fin de que este aprenda a esquivarlos y siga anotando goles”, detalla el magíster Sáenz.

El escenario de la IA

La inteligencia artificial es cada vez más usada en diferentes ámbitos, incluyendo sistemas robóticos que operan plantas de producción, detección de fraude en operaciones bancarias, y análisis y segmentación de compradores a partir de información de sus compras pasadas.

Usualmente, para que un jugador controlado por IA aprenda a jugar un videojuego, por ejemplo de baloncesto, se ponen todos los adversarios en el campo de juego desde el inicio y se le indica: “muévase, actúe”, y según sus acciones se le da una recompensa o un castigo.

Si hace una cesta se le recompensa, si los adversarios la hacen se le castiga. En este escenario es muy difícil que el jugador aprenda de manera rápida y efectiva, ya que desde el inicio existe una clara desventaja y recibirá muchas cestas en contra. Eventualmente aprenderá a evitar que le hagan puntos, y luego aprenderá a hacerlos, pero será necesario que juegue cientos y miles de millones de partidos para aprenderlo.

“La hipótesis de nuestro trabajo es que este proceso de dificultad incremental es más efectivo, en términos de la velocidad de aprendizaje”, asegura el investigador.

Los currículos que tuvieron el mejor desempeño exhibieron características comunes y redujeron el tiempo de entrenamiento desde un 15 hasta un 40 % en el mejor de los casos.

Si se tiene en cuenta que el tiempo de entrenamiento de un agente inteligente usualmente toma varias semanas, o incluso meses, la reducción resulta significativa.

Este tipo de entrenamientos se suelen ejecutar en servicios de computación en la nube que pueden resultar costosos, por lo que una reducción de tiempos de entrenamiento también se traduce en una disminución de costos.

Si bien la aplicación principal de los resultados de esta investigación es el desarrollo de NPC (Non-player character), que son los jugadores autónomos contra los que un jugador humano debe competir dentro de un videojuego, los resultados también se podrían aplicar a otros ámbitos como la robótica, la ciberseguridad y la conducción autónoma.

(Por: fin/SRB/MLA/LOF
)
N.° 256

Otras noticias

Medioambiente

abril 12 de 2021

Proceso químico garantizaría degradación de residuos de la industria textil

Un proceso de coagulación química y de oxidación que garantiza la degradación...

El estudio analizó características de los estudiantes como su nivel socioeconómico y sus actitudes hacia el aprendizaje. Foto: Joaquín Sarmiento / AFP.

Educación

abril 09 de 2021

Calidad de los colegios aporta a buenas notas de estudiantes vulnerables

Además de los aspectos relacionados directamente con el estudiante –como su...

Con el caso de estudio del canal El Mercado, se comprobó la ruptura entre lo natural y lo urbano en un sector particular de Barranquilla. Imagen: Diana Margarita Rocha G.

Ciudad & Territorio

abril 09 de 2021

La naturaleza debe ir de la mano con los proyectos urbanos

La desarticulación espacial y ambiental que presenta el Centro Histórico de...

Entrega del informe “La salud en el conflicto colombiano” a la Comisión de la Verdad. Foto: Joaquín Sarmiento / AFP.

Salud

abril 09 de 2021

Conflicto armado deja graves secuelas en salud de comunidades rurales

Afectaciones a la seguridad alimentaria, falta de acceso a medicamentos y...

Ladera en el barrio La Cumbre, de donde se tomaron muestras. Veleta utilizada para calcular el cortante tangencial. Foto: Unimedios.

Ciencia & Tecnología

abril 09 de 2021

Laderas no soportan pavimentación

Estas pendientes se están manejando mal, especialmente en Manizales, porque se...

Algunos metales como el hierro y el zinc a menudo son indispensables para los procesos biológicos. Fotos: Unimedios.

Salud

abril 09 de 2021

Metales pesados, con alto riesgo para salud de animales y humanos

Aunque algunos de estos elementos son necesarios para ciertos procesos...

Las políticas públicas son los proyectos y actividades que un Gobierno diseña y gestiona para satisfacer las necesidades de la ciudadanía. Fotos: Unimedios.

Política & Sociedad

abril 09 de 2021

Evaluación de políticas públicas no mejora eficiencia del Estado

Las entidades estatales gastan miles de millones de pesos en evaluación, pero...

Durante 176 noches se analizó el comportamiento de los monos nocturnos caribeños que habitan en San Juan de Carare (Santander). Foto: Sebastián Montilla.

Ciencia & Tecnología

abril 09 de 2021

Fobia a luz lunar de monos nocturnos haría que duerman más y se muevan menos

Tras analizar durante 176 noches el comportamiento de los monos nocturnos...

Participantes del conversatorio “Pandemia y pospandemia COVID-19: los retos de la salud pública”. Foto: Conversatorio Pandemia y Pospandemia Covid 19.

Educación

abril 08 de 2021

Maestría en Salud Pública llega a la UNAL Sede de La Paz

Este programa, que iniciará la primera cohorte el segundo semestre del presente...

Un impuesto a las bebidas azucaradas evitaría el ingreso al sistema de salud de cerca 400.000 enfermos por afecciones crónicas. Fotos: archivo Unimedios.

Salud

abril 08 de 2021

Impuesto del 24 % a bebidas azucaradas aliviaría el sistema de salud

Si en Colombia se aplicara dicho gravamen durante los próximos 25 años, se...