Nvidia、新BlackwellハードウェアとAIモデルで「物理AI」を強化
SIGGRAPH 2025において、Nvidiaは「物理AI」と呼ぶ壮大なビジョンを発表しました。これは、人工知能とコンピュータグラフィックスの戦略的融合であり、システムが現実世界でインテリジェントに相互作用することを可能にすることを目指しています。この野心的な取り組みは、先進的なロボット工学や自動運転車からスマートインフラストラクチャまで、あらゆるものを網羅しており、新しいハードウェア、洗練されたシミュレーションプラットフォーム、最先端のAIモデルを基盤としています。
NvidiaのAI研究担当バイスプレジデントであるSanja Fidlerは、「AIは私たちのシミュレーション能力を進化させ、私たちのシミュレーション能力はAIシステムを進化させています」と説明し、この戦略の中心にある共生関係を強調しました。同社の包括的なエコシステムは、これらの現実世界アプリケーションに必要な計算能力とインテリジェンスを提供するために設計されています。
Nvidiaの推進の中心にあるのは、Blackwellアーキテクチャに基づいた新しいハードウェア製品であり、要求の厳しいAIワークロード向けにカスタマイズされています。データセンター向けには、Nvidia RTX PRO 6000 BlackwellサーバーエディションGPUが、広く採用されている2Uフォームファクターを活用し、主流のエンタープライズサーバーに統合される予定です。Cisco、Dell Technologies、HPE、Lenovo、Supermicroなどの主要なシステムパートナーがこれらのサーバーを提供する予定です。Nvidiaは、これらのシステムが従来のCPUベースのアーキテクチャから加速コンピューティングプラットフォームへの大きな飛躍を表しており、CPUのみの構成と比較して最大45倍の高性能と18倍の優れたエネルギー効率を誇ると述べています。新しいGPUは、第5世代のTensorコアを搭載し、FP4形式をサポートしています。Nvidiaは、この重要なイノベーションにより、推論性能が前世代のL40S GPUと比較して6倍向上すると主張しています。
デスクトップセグメント向けには、Nvidiaは2つのコンパクトなグラフィックスカード、Nvidia RTX PRO 4000 SFF EditionとRTX PRO 2000 Blackwellを発表しました。これらのカードは、エンジニアリング、デザイン、3Dビジュアライゼーションなどの分野のプロフェッショナルに対応するため、より小型でエネルギー効率の高いワークステーションにAIアクセラレーションをもたらすように設計されています。RTX PRO 4000 SFFは、前モデルと同じ70ワットの消費電力で最大2.5倍のAI性能を提供すると報告されており、RTX PRO 2000は、コンピュータ支援設計(CAD)などで1.4倍高速な性能を提供すると言われています。これら両方の新しいGPUは、今年後半に利用可能になる予定です。
この強力な新しいハードウェアは、Nvidiaの物理AIビジョン、特にシミュレーションへの重点の計算基盤を提供します。中心となる考え方は、ロボットなどのAIシステムが、物理世界に展開する前に、広範な試行錯誤を通じて安全に学習できる、非常にリアルで物理的に正確なデジタルツインを作成することです。NvidiaのOmniverseおよびシミュレーション技術担当バイスプレジデントであるRev Lebaredianは、「コンピュータグラフィックスとAIは、ロボット工学を根本的に変革するために収束しています」と断言しました。
このシミュレーション優先のアプローチの技術的基盤は、Nvidia OmniverseおよびIsaacプラットフォームです。NvidiaはOmniverse向けの新しいソフトウェアライブラリを発表しました。これには、高度な3Dガウススプラッティング技術を使用してセンサーデータから現実世界の環境を再構築するOmniverse NuRecが含まれます。さらに、ロボットシミュレーションアプリケーションであるIsaac Sim 5.0とIsaac Lab 2.2は、これらの新しいレンダリング機能を組み込み、GitHubでオープンソースプロジェクトとして利用可能になりました。
このシミュレーション優先戦略の説得力のある現実世界での応用例は、Amazon Devices & Servicesの「ゼロタッチ」製造プロセスから来ています。ここでは、新製品のCADモデルがNvidia Isaac Simにインポートされ、50,000枚以上の合成画像が生成されます。これらの画像は、ロボットアームを制御するAIモデルのトレーニングに使用され、ロボットアームが自律的に品質チェックを実行したり、新製品を生産ラインに統合したりできるようになります。このプロセス全体は、シミュレーションで学習したスキルのみに依存しており、物理的なハードウェアの変更は不要です。FoundationPose姿勢推定モデルのような技術は、これらのロボットが事前のトレーニングなしに新しいオブジェクトさえも認識できるようにさらに強化します。
AIシステムが知覚するだけでなく、効果的に推論できるようにするため、NvidiaはAIモデルファミリーを拡張しました。エンタープライズアプリケーション向けに、NemotronファミリーにはNemotron Nano 2とLlama Nemotron Super 1.5が含まれるようになりました。これらのモデルは、AIエージェントが顧客サービスやサイバーセキュリティなどの分野で複雑な多段階タスクに取り組むことを可能にするように設計されています。Nvidiaは、ハイブリッドアーキテクチャと量子化(NVFP4)によって達成されるモデルの高い効率性を強調しています。CrowdStrike、Uber、Zoomなどの企業は、すでにこれらのモデルをテストしているか、統合を計画していると報告されています。
物理AI向けに特別に開発されたのが、カスタマイズ可能な70億パラメータのビジョン言語モデル(VLM)であるCosmos Reasonです。このモデルは、事前の知識、物理学の理解、および「常識」を組み込むことで、ロボットやビジョンAIエージェントが物理世界で解釈し、行動できるように設計されています。そのアプリケーションは、ロボットの計画、トレーニングデータの自動アノテーション、ビデオ分析に及びます。たとえば、UberはCosmos Reasonを使用して自動運転車の挙動を分析しており、VAST DataとMilestone Systemsはこれをインテリジェントな交通監視に採用しています。
これらの先進技術をインテリジェントインフラストラクチャの具体的なアプリケーションに変換するため、Nvidiaはこれらのコンポーネントの多くをMetropolisプラットフォームに統合しています。このプラットフォームは、Cosmos Reason VLMのシームレスな統合、TAO Toolkit内の新しいビジョン基盤モデル、Isaac Simの拡張によるまれなトレーニングシナリオの生成など、いくつかの新機能で強化されています。パートナーはすでにMetropolisを多様なソリューションに活用しています。AccentureとBeldenは、産業用ロボット周辺の作業員の安全性を高めるために、Omniverseでシミュレートされた「スマート仮想フェンス」を開発しています。DeepHowは、Metropolis VSSブループリントを使用して、作業指示を視覚的なガイドに変える「スマートノウハウコンパニオン」を開発しています。Anheuser-Busch InBevは、このソリューションを使用して新入社員のオンボーディング時間を80%短縮したと報告されています。
Nvidiaの「物理AI」イニシアチブは、デジタルシミュレーションと現実世界のインテリジェンスのギャップを埋めるための包括的な取り組みであり、機械が前例のない自律性と理解力で学習し、行動する未来を約束します。