Google DeepMind lanza Genie 3: El 'Modelo Mundial' que entrena robots IA

Google DeepMind ha presentado Genie 3, un nuevo “modelo mundial” capaz de generar entornos virtuales realistas para el entrenamiento de sistemas de inteligencia artificial. Este desarrollo, según el gigante tecnológico, representa un avance significativo hacia la consecución de la Inteligencia Artificial General (AGI), un estado hipotético en el que la IA puede realizar una amplia gama de tareas a nivel humano, en lugar de limitarse a funciones especializadas.

El modelo Genie 3 permite que los sistemas de IA interactúen dentro de simulaciones convincentes del mundo real. Google sugiere que podría ser fundamental para entrenar robots y vehículos autónomos, por ejemplo, permitiéndoles navegar y aprender dentro de almacenes virtuales altamente realistas. DeepMind, la división de IA de Google, enfatiza que dichos modelos mundiales son un componente crucial para el desarrollo de agentes de IA, sistemas diseñados para llevar a cabo tareas de forma autónoma. La compañía anticipa que esta tecnología desempeñará un papel fundamental a medida que los agentes de IA se vuelvan más prevalentes y la compañía avance hacia la AGI.

Genie 3 crea estos escenarios simulados instantáneamente a partir de indicaciones de texto. Los usuarios también pueden modificar rápidamente el entorno virtual con más comandos de texto; por ejemplo, introduciendo una manada de ciervos en una pista de esquí. Más allá del entrenamiento de la IA, Google señala que Genie 3 también podría permitir a los humanos experimentar diversas simulaciones para entrenamiento o exploración, como el esquí virtual o caminar alrededor de un lago de montaña.

Aunque Google demostró escenarios de esquí virtual y almacén a los periodistas, la compañía declaró que Genie 3 aún no está listo para su lanzamiento público completo y no proporcionó una fecha de lanzamiento, citando una serie de limitaciones. La calidad de estas simulaciones es comparable a la del último modelo de creación de video de Google, Veo 3, pero las simulaciones de Genie 3 pueden durar minutos, significativamente más que los clips de ocho segundos de Veo 3. Este anuncio se produce en medio de una creciente competencia en el sector de la IA, tras las recientes insinuaciones del CEO de OpenAI, Sam Altman, sobre su próximo modelo GPT-5.

Si bien las discusiones sobre la AGI a menudo se centran en su impacto potencial en los trabajos de oficina a medida que los sistemas autónomos asumen diversas funciones, Google considera principalmente los modelos mundiales como una tecnología fundamental para el avance de la robótica y los vehículos autónomos. Por ejemplo, un almacén simulado, completo con física realista e interacciones humanas, podría entrenar eficazmente a un robot, permitiéndole aprender y refinar sus acciones en un entorno seguro y controlado. Google también ha desarrollado Sima, un agente virtual capaz de realizar tareas dentro de entornos de videojuegos, aunque al igual que Genie 3, no está disponible públicamente.

Expertos en el campo subrayan la importancia de tales modelos. El profesor Subramanian Ramamoorthy, presidente de aprendizaje y autonomía de robots en la Universidad de Edimburgo, describió los modelos mundiales como “extremadamente importantes” para el desarrollo de robots. Explicó: “Para lograr una toma de decisiones flexible, los robots necesitan anticipar las consecuencias de diferentes acciones para elegir la mejor a ejecutar en el mundo físico”.

Andrew Rogoyski, del Instituto de IA Centrada en las Personas de la Universidad de Surrey, agregó que los modelos mundiales también podrían beneficiar a los grandes modelos de lenguaje (LLM), la tecnología que sustenta los chatbots como ChatGPT. Él cree que proporcionar a una “IA sin cuerpo la capacidad de ser encarnada, aunque virtualmente”, le permite “explorar el mundo, o un mundo, y crecer en capacidades como resultado”. Esta exploración física virtual, sugiere, añadiría una dimensión vital para crear IA más potentes e inteligentes, complementando su entrenamiento existente en vastas cantidades de datos de internet. Investigadores de Google señalaron previamente que, si bien los LLM sobresalen en la planificación, a menudo carecen de la capacidad de actuar en nombre de un humano, una brecha que los modelos mundiales podría ayudar a cerrar.

Google DeepMind lanza Genie 3: El 'Modelo Mundial' que entrena robots IA

Artículos Relacionados

Construyendo Agentes de IA Autoadaptables con Google Gemini y SAGE

Genie 3: La IA de DeepMind crea mundos 3D interactivos y consistentes

DeepMind's Genie 3: Nuevo Modelo Mundial Apunta a la IGA