La Visión 'Graphics 3.0' de Nvidia: Productividad Física con IA
Nvidia está liderando una nueva era que denomina “Graphics 3.0”, una visión donde las imágenes generadas por IA se vuelven fundamentales para impulsar la productividad en el mundo físico, particularmente dentro de fábricas y almacenes. Este concepto se aleja de los gráficos creados por humanos, aprovechando en su lugar las herramientas de IA generativa (genAI) para producir las imágenes necesarias. Nvidia cree que estos gráficos impulsados por IA desempeñarán un papel crucial en diversas aplicaciones, desde el entrenamiento de robots para tareas del mundo real hasta la asistencia a sistemas de IA en la automatización del diseño y la creación de equipos y estructuras.
“Creemos que ahora estamos en Graphics 3.0… potenciados por la IA”, afirmó Ming-Yu Liu, vicepresidente de investigación de Nvidia, durante un discurso principal en SIGGRAPH 2025, una destacada conferencia de gráficos celebrada recientemente en Vancouver, BC. Si bien las potentes GPU de Nvidia ya se utilizan ampliamente para modelos de IA generativa basados en texto y asistentes virtuales, la compañía concibe que Graphics 3.0 extienda la influencia de la IA directamente a nuestro entorno físico. Esto incluye permitir que la IA gestione robots, controle señales de tráfico, opere electrodomésticos, guíe vehículos autónomos y supervise equipos en diversos entornos como oficinas, fábricas y almacenes. El CEO de Nvidia, Jensen Huang, enfatizó aún más este potencial transformador en un discurso en video, prediciendo que los robots pronto “nos asistirán en nuestros hogares, redefinirán cómo se trabaja en fábricas, almacenes, agricultura y más”.
Sin embargo, la realización de Graphics 3.0 presenta desafíos únicos. A diferencia de la IA virtual, que a menudo se basa en abundantes datos de texto utilizados para entrenar grandes modelos fundacionales de empresas como OpenAI y Google, la IA física necesita datos basados en píxeles. Dichos datos no están tan fácilmente disponibles o son difíciles de adquirir en el mundo real. Para cerrar esta brecha, Nvidia está siendo pionera en la creación de datos sintéticos mediante la simulación de mundos virtuales completos adaptados para estas aplicaciones. “Los robots no aprenden de código. Aprenden de la experiencia”, explicó Huang, destacando el dilema central: “Pero el entrenamiento en el mundo real es lento y costoso”.
Para superar estos obstáculos, Nvidia ha desarrollado modelos avanzados de IA y herramientas de simulación diseñadas para generar los datos de píxeles precisos necesarios para entrenar robots, coches autónomos y otros dispositivos de IA física. Aaron Lefohn, vicepresidente de investigación del laboratorio de gráficos en tiempo real de Nvidia, señaló que estas innovaciones exigen “herramientas completamente nuevas para que los artistas puedan conceptualizar, crear e iterar órdenes de magnitud más rápidamente de lo que pueden hacerlo hoy”. Entre estos avances se encuentran los modelos Cosmos AI de Nvidia, diseñados para capacitar a los robots para interpretar comandos, detectar su entorno, razonar, planificar y ejecutar tareas dentro del dominio físico. Sonia Fidler, vicepresidenta de investigación del laboratorio de inteligencia espacial de Nvidia, subrayó cómo estos modelos son cruciales para inyectar inteligencia digital en el ámbito físico, añadiendo que “la IA física no puede escalar a través de prueba y error en el mundo real. Es inseguro, consume mucho tiempo y es costoso”. Un ejemplo principal es el entrenamiento de vehículos autónomos en entornos virtuales, un enfoque mucho más factible que estrellar repetidamente coches físicos para acumular datos de entrenamiento.
Esta semana, Nvidia también presentó Omniverse NuRec, una herramienta innovadora que convierte los datos de sensores del mundo real en simulaciones totalmente interactivas. Estas simulaciones proporcionan un espacio virtual seguro y eficiente donde los robots pueden someterse a entrenamiento y pruebas. Omniverse NuRec integra varias herramientas y modelos de IA para la construcción, simulación, renderizado y mejora de entornos digitales 3D detallados. La reconstrucción virtual de estos mundos se logra procesando datos 2D recopilados de cámaras y otros sensores, con cada píxel meticulosamente etiquetado basándose en una comprensión visual de los datos de sensores entrantes. Sin embargo, Fidler reconoció un matiz crítico: “Es muy importante recalcar aquí que la comprensión visual no es perfecta y debido a diferentes ambigüedades es difícil perfeccionarla”. Más allá de la simulación, la compañía también introdujo nuevas herramientas de generación de materiales con IA que facilitan la creación de gráficos altamente realistas, completos con detalles visuales auténticos como la reflectividad y las texturas de superficie. Estas herramientas permiten a los expertos e ingenieros 3D interactuar con asistentes de IA utilizando un lenguaje sencillo para describir sus requisitos de diseño, agilizando el proceso creativo.