Inteligencia ArtificialJuegos

Voyager, la Inteligencia Artificial impulsada con GPT-4 diseñada para jugar Minecraft

Un grupo de investigadores ha desarrollado Voyager, un agente de inteligencia artificial potenciado por la tecnología de GPT-4, con el objetivo específico de jugar Minecraft, el popular videojuego de exploración y construcción. Los resultados han sido impresionantes, ya que, según el estudio, la IA ha demostrado poseer una “notable competencia”.

Voyager, IA para jugar Minecraft

Este proyecto de investigación ha contado con la participación de científicos de Caltech, Stanford, la Universidad de Texas y NVIDIA. A diferencia de otros agentes de IA que han sido probados en Minecraft y han utilizado técnicas clásicas de aprendizaje por refuerzo, Voyager se basa en la generación de código para mejorar su rendimiento en Minecraft a través de GPT-4.

Voyager ha sido equipado con un “plan de estudios automático” diseñado para impulsar la exploración en el mundo de los píxeles, revela el informe del estudio. Además, aprovecha una “biblioteca de habilidades” en constante crecimiento, compuesta por código ejecutable, que permite almacenar y recuperar comportamientos complejos.

Como novedad, el agente de inteligencia artificial emplea un nuevo mecanismo de solicitud iterativo capaz de corregirse a sí mismo. Minecraft se caracteriza por ser un juego de mundo abierto, sin objetivos predefinidos, niveles ni tramas fijas. La exploración abierta exige a los jugadores desarrollar una variedad de habilidades y conocimientos.

En este contexto, la IA de Voyager demostró una notable autonomía y una rápida evolución sin intervención humana, según el estudio. El equipo de investigación realizó una comparación entre Voyager y otros agentes basados en modelos de lenguaje distintos a GPT-4 que también jugaron Minecraft.

Se convirtió en un experto del juego

Los resultados del experimento revelaron que Voyager fue capaz de descubrir el triple de elementos, viajar dos veces más lejos y alcanzar hitos 15 veces más rápido que los otros agentes. El aprovechamiento de GPT-4 en Minecraft fue fundamental para el éxito de la IA de Voyager. Los investigadores tomaron en cuenta que jugar Minecraft requiere de una cierta motivación para explorar y emprender nuevas tareas.

Por lo tanto, decidieron proporcionarle a Voyager un “plan de estudios” o “currículum automático” generado por GPT-4. A través de este, se le asignó un objetivo principal: “Descubrir tantas cosas diversas como sea posible”.

Conforme Voyager iba adquiriendo nuevos conocimientos en Minecraft, los desarrolladores los almacenaban en una “biblioteca de habilidades”, también gracias a un programa generado por GPT-4. Según explicaron los investigadores, “las habilidades desarrolladas por Voyager se expanden temporalmente, son interpretables y compositivas, lo que permite que el agente mejore rápidamente y evite el olvido catastrófico”.

La capacidad de Voyager para navegar distancias más largas y atravesar diversos terrenos fue un elemento crucial en su proceso de aprendizaje. En contraste, ReAct, Reflexion y AutoGPT, otros agentes de inteligencia artificial evaluados, a menudo quedaron limitados a áreas locales.

Minecraft, ideal para pruebas

Voyager destacó al ser el único agente capaz de desbloquear el nivel de diamantes en el árbol tecnológico (Tech Tree). El agente logró aprender con éxito nuevas tareas, como la elaboración exitosa de picos de diamantes, espadas doradas, cubos de lava y brújulas. Todo esto sin recibir entrenamiento previo ni poseer conocimientos previos.

Los investigadores enfatizaron que el experimento de GPT-4 en Minecraft sirve como punto de partida para el desarrollo de agentes de IA poderosos. Jim Fan, uno de los participantes del estudio, explicó en Twitter que “los agentes autónomos, generalmente competentes, representan la próxima frontera de la inteligencia artificial.

Continuamente exploran, planifican y desarrollan nuevas habilidades en mundos abiertos, impulsados por la supervivencia y la curiosidad”. Además, señaló que Minecraft es el mejor entorno de prueba con infinitas posibilidades para este tipo de agentes.

Artículos relacionados

Back to top button