Escudo de la República de Colombia

Ciencia & Tecnología

IA aprende más rápido un videojuego con niveles graduales de dificultad

Un jugador controlado con inteligencia artificial (IA) al que se le va incrementando la dificultad en cada videojuego aprende más rápido que cuando se trata de enseñarle con el máximo nivel de dificultad desde el inicio.

Bogotá D. C., 23 de noviembre de 2020Agencia de Noticias UN-

La IA se usa en sistemas robóticos que operan plantas de producción o detección de fraude en operaciones bancarias.

LA IA puede aprender más rápido a jugar un videojuego si se usan currículos de aprendizaje durante su entrenamiento.

Los currículos que tuvieron el mejor desempeño redujeron el tiempo de entrenamiento desde un 15 % hasta un 40%.

El magíster Sáenz diseñó 24 currículos, cada uno variando diferentes parámetros del partido a distintas velocidades.

Los resultados obtenidos también se podrían aplicar a otros ámbitos como la robótica, la ciberseguridad y la conducción autónoma.

Así lo determinó una investigación reciente que muestra cómo el aprendizaje por currículos, o métodos, puede reducir el tiempo de aprendizaje de un agente inteligente –que en esencia es un algoritmo de IA diseñado para ejecutar una tarea específica– en un videojuego.

En el estudio, realizado por Rigoberto Sáenz Imbacuán, magíster en Ingeniería de Sistemas y Computación de la Universidad Nacional de Colombia (UNAL), con la dirección del profesor Jorge Eliécer Camargo Mendoza, doctor en la misma área, se plantea cómo un agente inteligente potencialmente puede aprender más rápido a jugar un videojuego si se usan currículos de aprendizaje durante su entrenamiento. Estos currículos son un conjunto de parámetros que determinan como varía la dificultad del juego en el tiempo.

En los experimentos entrenaron al agente para que aprendiera un videojuego de minifútbol de dos jugadores usando un currículo en particular, durante 100 millones de partidos que fueron simulados usando el motor de videojuegos Unity.

En los currículos de mejor desempeño, el agente aprendió de manera óptima solo con 60 o 70 millones de partidos. En cada uno, el agente inteligente, representado como un cubo azul en el videojuego, competía con un adversario rojo; el campo de fútbol tenía barreras que evitaban que la pelota saliera del campo y facilitaba el entrenamiento.

El agente podía ver su entorno mediante rayos de detección lanzados continuamente en diferentes direcciones y que detectan todos los elementos presentes en el campo, incluyendo los adversarios, el balón, las barreras y los arcos.

El investigador diseñó 24 currículos variando en cada uno parámetros del partido a distintas velocidades, con el fin de determinar cuáles tenían mejor efecto en los tiempos de entrenamiento.

Cada currículo se puede interpretar como distintas formas de darle una ventaja al jugador. “Al inicio de un partido, para guiar el proceso de aprendizaje del jugador, puedo reducir la velocidad de movimiento de los adversarios dándole una ventaja significativa y permitiéndole aprender rápidamente a perseguir la pelota y empujarla al arco contrario. Cuando aprende a marcar goles aumento la velocidad de los adversarios, con el fin de que este aprenda a esquivarlos y siga anotando goles”, detalla el magíster Sáenz.

El escenario de la IA

La inteligencia artificial es cada vez más usada en diferentes ámbitos, incluyendo sistemas robóticos que operan plantas de producción, detección de fraude en operaciones bancarias, y análisis y segmentación de compradores a partir de información de sus compras pasadas.

Usualmente, para que un jugador controlado por IA aprenda a jugar un videojuego, por ejemplo de baloncesto, se ponen todos los adversarios en el campo de juego desde el inicio y se le indica: “muévase, actúe”, y según sus acciones se le da una recompensa o un castigo.

Si hace una cesta se le recompensa, si los adversarios la hacen se le castiga. En este escenario es muy difícil que el jugador aprenda de manera rápida y efectiva, ya que desde el inicio existe una clara desventaja y recibirá muchas cestas en contra. Eventualmente aprenderá a evitar que le hagan puntos, y luego aprenderá a hacerlos, pero será necesario que juegue cientos y miles de millones de partidos para aprenderlo.

“La hipótesis de nuestro trabajo es que este proceso de dificultad incremental es más efectivo, en términos de la velocidad de aprendizaje”, asegura el investigador.

Los currículos que tuvieron el mejor desempeño exhibieron características comunes y redujeron el tiempo de entrenamiento desde un 15 hasta un 40 % en el mejor de los casos.

Si se tiene en cuenta que el tiempo de entrenamiento de un agente inteligente usualmente toma varias semanas, o incluso meses, la reducción resulta significativa.

Este tipo de entrenamientos se suelen ejecutar en servicios de computación en la nube que pueden resultar costosos, por lo que una reducción de tiempos de entrenamiento también se traduce en una disminución de costos.

Si bien la aplicación principal de los resultados de esta investigación es el desarrollo de NPC (Non-player character), que son los jugadores autónomos contra los que un jugador humano debe competir dentro de un videojuego, los resultados también se podrían aplicar a otros ámbitos como la robótica, la ciberseguridad y la conducción autónoma.

(Por: fin/SRB/MLA/LOF
)
N.° 256

Otras noticias

Andrea Niño es la primera colombiana en formar parte como cantante solista de la prestigiosa Academia del Teatro alla Scala. Foto: Revista Opera Actual

Artes & Culturas

junio 11 de 2021

Egresada de la UNAL gana concurso internacional de canto lírico

La mezzosoprano colombiana Andrea Niño, egresada del Conservatorio de Música de...

La Supersolidaria establece las directrices para la prevención del lavado de activos del sector solidario o cooperativo. Fotos: Unimedios

Ciencia & Tecnología

junio 11 de 2021

Herramienta ayudaría a prevenir riesgo de transacciones inusuales

Un nuevo software les permite a las pequeñas empresas del sector solidario del...

La alta contaminación sería aportada especialmente por las comunidades ubicadas en los márgenes y laderas de los dos ríos. Fotos: Soendra Cardona.

Medioambiente

junio 11 de 2021

Sangoyaco y Taruca, dos ríos que agonizan por contaminación

La alta contaminación se debería especialmente a que las comunidades ubicadas...

Participantes de la quinta sesión Diálogos Convergentes “Derechos fundamentales a la salud y sistema de salud”. Foto: Captura del evento

Política & Sociedad

junio 11 de 2021

Construir un nuevo sistema de salud implica un cambio profundo

“Colombia tiene que revisar el modelo de desarrollo, de lo contrario nunca...

Las becas “Lucía Galvis” de la UNAL Sede Manizales apoyan económicamente a jóvenes de primeros y último semestre. Fotos: Unimedios

Educación

junio 11 de 2021

UNAL Sede Manizales crea becas “Lucía Galvis”

El promotor de la iniciativa es el diseñador industrial Andrés Fernando Serrano...

El pollo es la proteína más consumida en el mundo. En Colombia se calculan 35 kilos y 300 huevos por persona al año. Fotos: Unimedios.

Desarrollo Rural

junio 11 de 2021

Bacilos y orégano, mejores que los antibióticos para pollos de engorde

Reemplazar ciertos antibióticos que se usan en la industria avícola –para...

El dispositivo automatiza la pronación, una maniobra que se usa en pacientes en cuidados intensivos. Foto: Mario Giraldo

Ciencia & Tecnología

junio 10 de 2021

Co-creador de robot para pacientes UCI, Inventor 2020

Un robot que ayuda a la pronación de pacientes –ubicarlos en posición boca...

Educación

junio 10 de 2021

Comunicado No. 07 de 2021 de la Rectoría

La Universidad Nacional de Colombia, consciente de su responsabilidad como...

El frijol es la leguminosa de consumo directo más importante para el ser humano, ya que es fuente de proteínas y micronutrientes. Fotos: Sergio Cruz.

Desarrollo Rural

junio 10 de 2021

Variación genética mejoraría adaptación del frijol al calor

Con el cruzamiento del frijol común y una especie silvestre adaptada a los...

Los robledales, sistemas muy importantes para la biodiversidad colombiana, fueron altamente afectados en el pasado. Foto: Raul ARBOLEDA / AFP

Medioambiente

junio 10 de 2021

Del Amazonas a los Andes, insumos para el mapa de vegetación de Colombia

La información sobre las formaciones vegetales en la historia del territorio...