Escudo de la República de Colombia

Ciencia & Tecnología

IA aprende más rápido un videojuego con niveles graduales de dificultad

Un jugador controlado con inteligencia artificial (IA) al que se le va incrementando la dificultad en cada videojuego aprende más rápido que cuando se trata de enseñarle con el máximo nivel de dificultad desde el inicio.

Bogotá D. C., 23 de noviembre de 2020Agencia de Noticias UN-

La IA se usa en sistemas robóticos que operan plantas de producción o detección de fraude en operaciones bancarias.

LA IA puede aprender más rápido a jugar un videojuego si se usan currículos de aprendizaje durante su entrenamiento.

Los currículos que tuvieron el mejor desempeño redujeron el tiempo de entrenamiento desde un 15 % hasta un 40%.

El magíster Sáenz diseñó 24 currículos, cada uno variando diferentes parámetros del partido a distintas velocidades.

Los resultados obtenidos también se podrían aplicar a otros ámbitos como la robótica, la ciberseguridad y la conducción autónoma.

Así lo determinó una investigación reciente que muestra cómo el aprendizaje por currículos, o métodos, puede reducir el tiempo de aprendizaje de un agente inteligente –que en esencia es un algoritmo de IA diseñado para ejecutar una tarea específica– en un videojuego.

En el estudio, realizado por Rigoberto Sáenz Imbacuán, magíster en Ingeniería de Sistemas y Computación de la Universidad Nacional de Colombia (UNAL), con la dirección del profesor Jorge Eliécer Camargo Mendoza, doctor en la misma área, se plantea cómo un agente inteligente potencialmente puede aprender más rápido a jugar un videojuego si se usan currículos de aprendizaje durante su entrenamiento. Estos currículos son un conjunto de parámetros que determinan como varía la dificultad del juego en el tiempo.

En los experimentos entrenaron al agente para que aprendiera un videojuego de minifútbol de dos jugadores usando un currículo en particular, durante 100 millones de partidos que fueron simulados usando el motor de videojuegos Unity.

En los currículos de mejor desempeño, el agente aprendió de manera óptima solo con 60 o 70 millones de partidos. En cada uno, el agente inteligente, representado como un cubo azul en el videojuego, competía con un adversario rojo; el campo de fútbol tenía barreras que evitaban que la pelota saliera del campo y facilitaba el entrenamiento.

El agente podía ver su entorno mediante rayos de detección lanzados continuamente en diferentes direcciones y que detectan todos los elementos presentes en el campo, incluyendo los adversarios, el balón, las barreras y los arcos.

El investigador diseñó 24 currículos variando en cada uno parámetros del partido a distintas velocidades, con el fin de determinar cuáles tenían mejor efecto en los tiempos de entrenamiento.

Cada currículo se puede interpretar como distintas formas de darle una ventaja al jugador. “Al inicio de un partido, para guiar el proceso de aprendizaje del jugador, puedo reducir la velocidad de movimiento de los adversarios dándole una ventaja significativa y permitiéndole aprender rápidamente a perseguir la pelota y empujarla al arco contrario. Cuando aprende a marcar goles aumento la velocidad de los adversarios, con el fin de que este aprenda a esquivarlos y siga anotando goles”, detalla el magíster Sáenz.

El escenario de la IA

La inteligencia artificial es cada vez más usada en diferentes ámbitos, incluyendo sistemas robóticos que operan plantas de producción, detección de fraude en operaciones bancarias, y análisis y segmentación de compradores a partir de información de sus compras pasadas.

Usualmente, para que un jugador controlado por IA aprenda a jugar un videojuego, por ejemplo de baloncesto, se ponen todos los adversarios en el campo de juego desde el inicio y se le indica: “muévase, actúe”, y según sus acciones se le da una recompensa o un castigo.

Si hace una cesta se le recompensa, si los adversarios la hacen se le castiga. En este escenario es muy difícil que el jugador aprenda de manera rápida y efectiva, ya que desde el inicio existe una clara desventaja y recibirá muchas cestas en contra. Eventualmente aprenderá a evitar que le hagan puntos, y luego aprenderá a hacerlos, pero será necesario que juegue cientos y miles de millones de partidos para aprenderlo.

“La hipótesis de nuestro trabajo es que este proceso de dificultad incremental es más efectivo, en términos de la velocidad de aprendizaje”, asegura el investigador.

Los currículos que tuvieron el mejor desempeño exhibieron características comunes y redujeron el tiempo de entrenamiento desde un 15 hasta un 40 % en el mejor de los casos.

Si se tiene en cuenta que el tiempo de entrenamiento de un agente inteligente usualmente toma varias semanas, o incluso meses, la reducción resulta significativa.

Este tipo de entrenamientos se suelen ejecutar en servicios de computación en la nube que pueden resultar costosos, por lo que una reducción de tiempos de entrenamiento también se traduce en una disminución de costos.

Si bien la aplicación principal de los resultados de esta investigación es el desarrollo de NPC (Non-player character), que son los jugadores autónomos contra los que un jugador humano debe competir dentro de un videojuego, los resultados también se podrían aplicar a otros ámbitos como la robótica, la ciberseguridad y la conducción autónoma.

(Por: fin/SRB/MLA/LOF
)
N.° 256

Otras noticias

Los procedimientos quirúrgicos cancelados durante la pandemia se convierten en urgencias que ocupan al sistema hospitalario. Foto: HUN

Salud

junio 21 de 2021

Pacientes crónicos también llegan a UCI en este pico de la pandemia

Por distintas razones originadas a raíz de la pandemia, como el temor al...

En Estados Unidos se han suministrado 318 millones de dosis de vacunas contra COVID-19. Foto: CHANDAN KHANNA / AFP

Salud

junio 21 de 2021

Tratamientos contra COVID-19: la búsqueda continúa

De los 600 productos –entre vacunas y otros tratamientos– creados para...

Portada del especial “Tocar fondo para cambiar de rumbo”, disponible en UN Periódico Digital. Foto: Brandon Pinto.

Política & Sociedad

junio 21 de 2021

Tocar fondo para cambiar de rumbo, nuevo especial de UN Periódico Digital

La urgencia de una renta básica de emergencia para los hogares más vulnerables...

El paso del huracán Iota por las Islas de San Andrés, Providencia y Santa Catalina muestra la falta de preparación tanto del Estado como de la comunidad para afrontar estos eventos naturales. Foto: EFRAIN HERRERA / Colombian Presidency / AFP"

Medioambiente

junio 21 de 2021

“El desastre no fue el huracán, fue la falta de preparación”

“Empaqué mis libros, mi computadora y algunos documentos que para mí eran...

El modelamiento permitirá analizar estructuras ya construidas para remediar fallas como las que ocurrieron en el edificio Space. Foto: Sebastián Echavarría.

Ciencia & Tecnología

junio 21 de 2021

Modelamiento multiescala mediría impacto de sismos en los edificios

Al identificar el impacto causado por los sismos en los edificios y elementos...

La Estampilla Pro UNAL Sede Caribe podría recaudar hasta 300.000 millones de pesos para la Institución en esta región del país. Fotos: archivo Unimedios.

Educación

junio 18 de 2021

Aprobada en el Senado Estampilla Pro UNAL Sede Caribe

El Senado de la República aprobó el proyecto de Ley 328 de 2020, por medio del...

Contaminación y disminución de flora y fauna son algunos de los problemas que afectan a los humedales de Amazonas. Fotos: Harrison Calderón, UNAL Sede Leticia.

Medioambiente

junio 18 de 2021

Humedales de Leticia, a conocerlos para cuidarlos

Una iniciativa de la Universidad Nacional de Colombia (UNAL) busca sensibilizar...

La meta es que la energía eólica y la solar sean las principales fuentes de abastecimiento del país, de modo que las hidroeléctricas se usen cuando no haya vientos o radiación. Foto: Paul ELLIS / AFP

Medioambiente

junio 18 de 2021

Primer mapa de zonas aptas para generar energía solar y eólica

La nueva representación geográfica establece, por ejemplo, que en energía...

El estudio tomó como referencia tres municipios turísticos con actividad agrícola en Antioquia: Santa Fe de Antioquia, San Jerónimo y Sopetrán. Foto Alcaldía de Santa Fe de Antioquia.

Medioambiente

junio 18 de 2021

Turismo amenaza agro y ambiente en el occidente de Antioquia

El boom inmobiliario y turístico que vive esa región –que incluye municipios...

Mayor Gil Farekade, autoridad tradicional del Cabildo Indígena Herederos del Tabaco, la Coca y la Yuca Dulce (Cihtacoyd). Fotos: Unimedios Amazonia.

Artes & Culturas

junio 18 de 2021

Bienestar, ruta de vida del hombre murui

El buen vivir es la causa máxima y final de este pueblo indígena, para quienes...