英伟达“图形3.0”愿景:AI驱动的实体生产力

Computerworld

英伟达正在倡导一个它称之为“图形3.0”的新时代,这是一个AI生成视觉效果成为提升物理世界(尤其是在工厂和仓库中)生产力基础的愿景。这一概念摆脱了人类创建图形的传统方式,转而利用生成式AI(genAI)工具来生成所需的图像。英伟达相信,这些AI驱动的图形将在各种应用中发挥关键作用,从训练机器人执行真实世界任务,到协助AI系统自动化设计和创建设备与结构。

英伟达研究副总裁刘鸣宇在近期于加拿大温哥华举行的SIGGRAPH 2025图形大会主题演讲中表示:“我们相信,我们现在正处于由AI提供超强动力的图形3.0时代。”尽管英伟达强大的GPU已广泛用于基于文本的生成式AI模型和虚拟助手,但该公司设想图形30将AI的影响力直接扩展到我们的物理环境。这包括使AI能够管理机器人、控制交通信号、操作家用电器、引导自动驾驶汽车,以及监督办公室、工厂和仓库等多样化环境中的设备。英伟达首席执行官黄仁勋在一次视频讲话中进一步强调了这种变革潜力,他预测机器人很快将“在我们的家中帮助我们,重新定义工厂、仓库、农业等领域的工作方式。”

然而,实现图形3.0面临独特的挑战。与虚拟AI(通常依赖于OpenAI和谷歌等公司用于训练大型基础模型的丰富文本数据)不同,物理AI需要基于像素的数据。此类数据在现实世界中不易获取或获得。为了弥补这一差距,英伟达正在开创通过模拟为这些应用量身定制的全面虚拟世界来创建合成数据。黄仁勋解释说:“机器人不是从代码中学习。它们是从经验中学习的。”他强调了核心困境:“但现实世界中的训练既缓慢又昂贵。”

为了克服这些障碍,英伟达开发了先进的AI模型和模拟工具,旨在生成训练机器人、自动驾驶汽车和其他物理AI设备所需的精确像素数据。英伟达实时图形实验室研究副总裁Aaron Lefohn指出,这些创新需要“全新的工具,以便艺术家能够比今天更快地进行概念化、创建和迭代。”这些进展中包括英伟达的Cosmos AI模型,它们旨在赋能机器人解释指令、感知周围环境、推理、规划并在物理领域执行任务。英伟达空间智能实验室研究副总裁Sonia Fidler强调了这些模型对于将数字智能注入物理领域的重要性,并补充道:“物理AI无法通过现实世界的试错来扩展。这不安全、耗时且昂贵。”一个主要例子是在虚拟环境中训练自动驾驶汽车,这比反复撞毁实体汽车来积累训练数据要可行得多。

本周,英伟达还发布了Omniverse NuRec,这是一款突破性工具,可将真实世界传感器数据转换为完全交互式的模拟。这些模拟提供了一个安全高效的虚拟空间,供机器人进行训练和测试。Omniverse NuRec集成了各种工具和AI模型,用于构建、模拟、渲染和增强详细的3D数字环境。这些世界的虚拟重建是通过处理从摄像头和其他传感器收集的2D数据来实现的,每个像素都根据对传入传感器数据的视觉理解进行精细标记。然而,Fidler承认了一个关键的细微差别:“这里非常重要的是要强调视觉理解并不完美,并且由于不同的模糊性,很难做到完美。”除了模拟之外,该公司还推出了新的AI材质生成工具,有助于创建高度逼真的图形,并包含反射率和表面纹理等真实的视觉细节。这些工具允许3D专家和工程师使用简单的语言向AI助手描述他们的设计要求,从而简化了创作过程。