英伟达在SIGGRAPH推出全新AI与机器人工具,加速自主系统发展

Theaiinsider

英伟达(Nvidia)公布了其技术堆栈的重大扩展,旨在加速先进机器人技术的开发,将计算机图形和人工智能领域融合在一起。这些创新在温哥华举行的SIGGRAPH大会上发布,包括新的Omniverse库、先进的Cosmos物理AI模型以及强大的AI计算基础设施,所有这些都旨在使机器人和自主系统更强大、适应性更强、商业可行性更高。

英伟达机器人技术推进的核心是新的Omniverse库,它们增强了机器人设计和部署至关重要的模拟能力。其中之一是Omniverse NuRec 3D高斯泼溅库,这是一个强大的工具,使开发人员能够利用传感器数据高保真地捕捉、重建和模拟真实世界环境。这对于创建精确的“数字孪生”至关重要,机器人可以在实际部署前安全地学习和操作。此外,新的Omniverse软件开发工具包(SDK)通过支持MuJoCo(MJCF)和通用场景描述(OpenUSD)格式之间的数据交换,促进了更大的互操作性,为广大的机器人学习开发人员社区开启了无缝模拟的可能性。该公司还更新了其开源机器人模拟和学习框架NVIDIA Isaac Sim 5.0和NVIDIA Isaac Lab 2.2(现已在GitHub上提供),以整合这些增强功能,并帮助弥合“模拟到现实”的鸿沟。

补充模拟进步的是新的Cosmos物理AI模型,它们对于赋予机器人智能和推理能力至关重要。其中最突出的是Cosmos Reason,一个70亿参数的视觉语言模型(VLM),专为物理AI和机器人技术设计。该模型使机器人和视觉AI代理能够像人类一样进行推理,利用先验知识、物理理解和常识来解释并在现实世界中行动。这项能力将彻底改变数据整理、机器人规划和视频分析等任务。另一个关键的补充是Cosmos Transfer-2,它简化了从3D模拟场景生成合成数据集的过程,大大减少了为机器人生成逼真训练数据所需的时间和成本。

为了支持这些高要求的AI和模拟工作负载,英伟达引入了新的AI计算基础设施。这包括NVIDIA RTX PRO Blackwell服务器,它们为机器人开发的每个阶段(从训练和合成数据生成到机器人学习和模拟)提供统一的架构。此外,NVIDIA DGX Cloud现已在Microsoft Azure Marketplace上提供,提供一个完全托管的平台,简化了OpenUSD和基于RTX的应用程序从云端大规模流式传输的复杂性,最大限度地减少了开发人员在基础设施管理方面的复杂性。

英伟达的总体战略围绕着“物理AI”展开,这个术语意味着人工智能和计算机图形的融合,以创建能够与物理世界智能交互的系统。英伟达Omniverse和模拟技术副总裁Rev Lebaredian强调,AI推理和可扩展的、物理精确的模拟相结合,有望从根本上改变万亿美元产业中的机器人技术和自动驾驶汽车。这一愿景与英伟达首席执行官黄仁勋的声明不谋而合,他表示2020年代将是“机器人十年”,届时AI驱动的机器将彻底改变从制造和物流到医疗保健的各个领域。

业界对这些新技术的采纳已经显而易见,亚马逊设备与服务、波士顿动力、Figure AI和Hexagon等领先公司正在采用英伟达的模拟和合成数据生成工具。其他值得注意的采用者包括优步(Uber),它正在利用Cosmos Reason注释自动驾驶汽车训练数据;以及Foretellix,它正在整合NuRec以增强自动驾驶汽车的合成数据生成。

英伟达在SIGGRAPH 2025上的最新公告,突显了其作为蓬勃发展的先进机器人领域基础技术提供商的战略定位。通过提供一个包含模拟工具、智能AI模型和强大计算基础设施的综合生态系统,该公司正在使开发人员能够构建下一代机器人和自主系统,这些系统能够在物理世界中以空前的能力进行感知、推理和行动。