英伟达研究实验室:从12人到4万亿,AI与机器人帝国的幕后推手
当比尔·戴利于2009年加入英伟达的研究实验室时,那是一个只有十几人的小团队,主要专注于光线追踪——一种用于计算机图形的复杂渲染技术。如今,这个曾经不起眼的研究部门已发展到400多人,在将英伟达从一家以视频游戏GPU闻名的九十年代初创公司,转变为人工智能革命前沿的4万亿美元巨头方面,发挥了举足轻重的作用。现在,该实验室正致力于开发机器人和高级AI的基础技术,其一些开创性工作已出现在商业产品中,包括最近推出的一套专为机器人开发者设计的新AI模型、库和基础设施。
戴利,现任英伟达首席科学家,早在2003年还在斯坦福大学任职时就开始为公司提供咨询。几年后,当他准备辞去斯坦福大学计算机科学系主任一职时,他计划休一个学术假。然而,英伟达有不同的设想。当时领导研究实验室的大卫·柯克和英伟达首席执行官黄仁勋认为,一个永久职位是更好的选择。戴利回忆了他们“全面施压”说服他的努力,最终成功了。他反思说,这个职位“完美契合”了他的兴趣和才能,是他能为世界做出最重要贡献的地方。
2009年掌舵实验室后,戴利优先考虑扩张。研究人员立即将研究范围扩展到光线追踪之外,深入研究电路设计和超大规模集成(VLSI)等领域,这是一种将数百万个晶体管封装到单个微芯片上的复杂工艺。从那时起,实验室的增长一直持续不断。戴利强调了研究的战略方法,不断评估新的和令人兴奋的领域,以确定那些对公司产生积极影响潜力最大的领域。
在相当长的一段时间里,这一战略重点转化为为人工智能构建卓越的GPU。英伟达很早就进入了新兴的AI领域,早在2010年就开始探索AI优化型GPU的概念——比当前AI热潮兴起早了十多年。戴利回忆说,他很早就认识到AI的变革潜力,并说服黄仁勋“加倍投入”。这种远见促使他们的GPU专业化,开发了广泛的支持软件,并在主流认识到其重要性之前,就主动与全球AI研究人员进行接触。
随着英伟达如今在AI GPU市场占据主导地位,公司的研究重点已转向识别AI数据中心之外的新前沿。这一探索使他们直接进入了物理AI和机器人领域。戴利设想了一个机器人将成为巨大全球力量的未来,英伟达的目标是成为“所有机器人的大脑”,这需要开发关键的基础技术。
这就是英伟达AI研究副总裁桑贾·菲德勒的切入点。菲德勒于2018年加入该研究实验室,此前她已与麻省理工学院的团队一起参与开发机器人仿真模型。她的工作在一次研究人员招待会上立即引起了黄仁勋的兴趣。菲德勒形容加入英伟达的决定是不可抗拒的,她提到了引人入胜的主题和强大的文化契合度。黄仁勋的邀请——“来和我一起工作,而不是和我们一起,也不是为我们工作”——引起了她深深的共鸣。
菲德勒随后在多伦多建立了一个研究实验室,专注于在英伟达的虚拟世界创建平台Omniverse中为物理AI构建仿真。构建这些仿真环境的一个主要挑战是获取必要的3D数据。这不仅涉及获取大量潜在图像,还涉及开发将这些图像转换为可供模拟器使用的3D渲染的技术。英伟达投资了“可微分渲染”技术,这是一种使渲染适用于AI的技术,能够将2D图像或视频转换为3D模型。
Omniverse于2021年发布了其图像到3D模型的首个迭代产品GANverse3D,随后又解决了视频的相同过程。通过利用机器人和自动驾驶汽车的视频,他们开发了Neuric神经重建引擎(于2222年首次宣布),以创建这些高级3D模型和仿真。这些创新构成了公司Cosmos系列世界AI模型的技术骨干,该系列于1月在CES上亮相。
该实验室目前的重点是显著加速这些模型。正如视频游戏需要实时响应一样,机器人需要更快的反应时间。菲德勒解释说,机器人处理世界可以比世界展开的速度快100倍,这意味着使这些模型大大加快对于机器人和物理AI应用将具有巨大的价值。英伟达在该领域继续取得进展,最近宣布了一系列新的世界AI模型,专门用于生成合成数据来训练机器人,同时还为机器人开发者提供了新的库和基础设施软件。
尽管机器人领域取得了快速进展,尤其是在人形机器人方面,英伟达研究团队仍保持着现实的视角。戴利和菲德勒都警告说,人形机器人广泛进入家庭还需要几年时间,并将其与自动驾驶汽车相关的炒作和时间线进行类比。戴利强调,从使机器人感知成为可能的视觉AI到协助任务和运动规划及操作的生成式AI,人工智能一直是关键的推动者。随着各个挑战的克服和神经网络训练数据量的扩大,这些机器人的能力将继续呈指数级增长。