NVIDIA Revela Pila de IA Integral y Modelos Cosmos para Robótica Avanzada

Marktechpost

NVIDIA presentó una suite completa de nuevas tecnologías en SIGGRAPH 2025, lo que marca un avance significativo en el desarrollo de la IA física para robótica, vehículos autónomos y aplicaciones industriales. Este nuevo ecosistema, que abarca modelos mundiales Cosmos avanzados, robustas bibliotecas de simulación Omniverse e infraestructura de vanguardia, está diseñado para acelerar el viaje desde el entrenamiento virtual hasta el despliegue en el mundo real.

El núcleo de este anuncio son los Modelos Fundacionales Cosmos World, diseñados para dotar a los robots de capacidades de razonamiento mejoradas. Entre ellos se encuentra Cosmos Reason, un modelo de visión-lenguaje de 7 mil millones de parámetros diseñado específicamente para agentes inteligentes que operan en escenarios complejos del mundo real. Esta IA cuenta con memoria avanzada para el razonamiento espacial y temporal, junto con una comprensión intrínseca de las leyes físicas. Tales capacidades permiten a los robots y agentes de IA planificar meticulosamente acciones paso a paso dentro de entornos dinámicos, lo que resulta invaluable para tareas como la curación de datos, la planificación sofisticada de robots y el análisis detallado de video. El modelo procesa diversos datos de sensores, incluyendo video y LIDAR, alimentándolos a un motor de razonamiento que dicta los movimientos subsiguientes de un agente. Soporta tanto la interpretación de instrucciones de alto nivel como la generación de acciones granulares, imitando la lógica humana para la navegación y manipulación.

Complementando a Cosmos Reason están los modelos Cosmos Transfer, que aceleran drásticamente la generación de conjuntos de datos sintéticos. Cosmos Transfer-2, por ejemplo, crea rápidamente datos de entrenamiento a partir de escenas de simulación 3D o entradas de control espacial, reduciendo significativamente el tiempo y el costo típicamente asociados con la producción de datos de entrenamiento de robots realistas. Esto es particularmente beneficioso para el aprendizaje por refuerzo y la validación de modelos de políticas, donde la necesidad de modelar casos extremos, iluminación variada y diversas condiciones climáticas a escala es primordial. Una “Variante de Transferencia Destilada” optimizada mejora aún más la velocidad, permitiendo a los desarrolladores iterar en la creación de conjuntos de datos con una agilidad sin precedentes. La familia de modelos fundacionales Cosmos World ofrece versatilidad, abarcando las categorías Nano, Super y Ultra con recuentos de parámetros que van desde 4 mil millones hasta 14 mil millones, lo que permite un ajuste fino para latencia, fidelidad y casos de uso específicos, desde la transmisión en tiempo real hasta la renderización fotorrealista.

La plataforma Omniverse de NVIDIA también recibió una actualización sustancial, introduciendo nuevas bibliotecas de simulación y renderización cruciales para crear entornos de entrenamiento virtuales realistas. Las Bibliotecas de Reconstrucción Neural ahora permiten a los desarrolladores importar datos de sensores y renderizar el mundo físico en 3D con un fotorrealismo realista, aprovechando técnicas de renderización avanzadas. La integración mejorada con OpenUSD y el Simulador CARLA, a través de nuevas herramientas de conversión y capacidades de renderización, tiene como objetivo estandarizar flujos de trabajo de simulación complejos, facilitando la interoperabilidad sin problemas entre varios marcos de robótica como Mujoco y la tubería basada en USD de NVIDIA. Además, una nueva Biblioteca de Materiales SimReady ofrece miles de materiales de sustrato, lo que aumenta significativamente la fidelidad del entrenamiento y la simulación de robótica. El motor de simulación dedicado de NVIDIA, Isaac Sim 5.0.0, también ha sido actualizado con modelos de actuadores mejorados, mayor soporte para Python y ROS, y mejoras en la renderización neuronal para una generación superior de datos sintéticos.

Para apoyar estos modelos y simulaciones avanzados, NVIDIA introdujo infraestructura especialmente diseñada para flujos de trabajo de robótica. Los servidores RTX Pro Blackwell proporcionan una arquitectura unificada optimizada para las exigentes tareas de simulación, entrenamiento e inferencia en el desarrollo robótico. Además, DGX Cloud ofrece una solución escalable basada en la nube para gestionar flujos de trabajo de IA física, permitiendo a los equipos desarrollar, entrenar y desplegar agentes de IA de forma remota desde cualquier lugar.

La industria ha reconocido rápidamente el potencial de estas innovaciones. Empresas líderes, incluyendo Amazon Devices, Agility Robotics, Figure AI, Uber y Boston Dynamics, ya están probando los modelos Cosmos y las herramientas Omniverse. Están aprovechando estas tecnologías para generar datos de entrenamiento críticos, construir gemelos digitales y acelerar el despliegue de la robótica en los sectores de fabricación, transporte y logística. NVIDIA ha puesto los modelos Cosmos ampliamente disponibles a través de su API y catálogos de desarrolladores, ofreciendo una licencia permisiva que soporta tanto aplicaciones de investigación como comerciales.

La visión de NVIDIA es clara: la IA física representa un desafío integral y de pila completa. Al ofrecer modelos más inteligentes, capacidades de simulación más ricas e infraestructura escalable, NVIDIA tiene como objetivo cerrar la brecha crítica entre el entrenamiento virtual y el despliegue en el mundo real. Este enfoque integrado promete reducir significativamente los costosos ensayos y errores en el desarrollo de la robótica, desbloqueando niveles de autonomía sin precedentes para agentes y robots inteligentes.