NVIDIA、ロボット工学向けにエンドツーエンドAIスタックとCosmosモデルを発表
NVIDIAはSIGGRAPH 2025で包括的な新技術スイートを発表し、ロボット工学、自動運転車、産業アプリケーション向けの物理AI開発における大きな飛躍を示しました。この新しいエコシステムは、高度なCosmosワールドモデル、堅牢なOmniverseシミュレーションライブラリ、最先端のインフラストラクチャを包含し、仮想トレーニングから実世界への展開までの道のりを加速するように設計されています。
この発表の核となるのは、ロボットに強化された推論能力を付与するように設計されたCosmos World Foundation Modelsです。その中でも、Cosmos Reasonは、複雑な実世界シナリオで動作するインテリジェントエージェントのために特別に設計された70億パラメータの視覚言語モデルです。このAIは、空間的および時間的推論のための高度なメモリと、物理法則に対する本質的な理解を誇っています。このような能力により、ロボットやAIエージェントは動的な環境内で段階的なアクションを綿密に計画でき、データキュレーション、高度なロボット計画、詳細なビデオ分析などのタスクに非常に貴重です。このモデルは、ビデオやLIDARを含む多様なセンサーデータを処理し、それをエージェントの次の動きを指示する推論エンジンに供給します。高レベルの指示解釈と詳細なアクション生成の両方をサポートし、ナビゲーションと操作において人間のようなロジックを模倣します。
Cosmos Reasonを補完するのがCosmos Transferモデルで、合成データセットの生成を劇的に加速します。たとえば、Cosmos Transfer-2は、3Dシミュレーションシーンまたは空間制御入力からトレーニングデータを迅速に作成し、通常、現実的なロボットトレーニングデータの生成に伴う時間とコストを大幅に削減します。これは、強化学習やポリシーモデルの検証に特に有益であり、エッジケース、多様な照明、さまざまな気象条件を大規模にモデル化する必要性が最も重要です。最適化された「Distilled Transfer Variant」はさらに速度を向上させ、開発者が前例のない俊敏性でデータセットの作成を反復できるようにします。Cosmos World Foundation Modelファミリー自体は汎用性を提供し、Nano、Super、Ultraのカテゴリにまたがり、パラメータ数は40億から140億に及び、リアルタイムストリーミングからフォトリアリスティックレンダリングまで、特定のレイテンシ、忠実度、ユースケースに合わせて微調整が可能です。
NVIDIAのOmniverseプラットフォームも大幅なアップデートを受け、現実的な仮想トレーニング環境を作成するために不可欠な新しいシミュレーションおよびレンダリングライブラリが導入されました。Neural Reconstruction Librariesにより、開発者はセンサーデータをインポートし、高度なレンダリング技術を活用して物理世界を3Dでリアルなフォトリアリズムでレンダリングできるようになりました。新しい変換ツールとレンダリング機能を通じて、OpenUSDおよびCARLAシミュレーターとの統合が強化され、複雑なシミュレーションワークフローを標準化し、MujocoやNVIDIAのUSDベースのパイプラインなどのさまざまなロボット工学フレームワーク間のシームレスな相互運用性を促進することを目指しています。さらに、新しいSimReady Materials Libraryは数千の基板材料を提供し、ロボット工学のトレーニングとシミュレーションの忠実度を大幅に向上させます。NVIDIAの専用シミュレーションエンジンIsaac Sim 5.0.0も、アクチュエータモデルの強化、PythonおよびROSサポートの拡大、および優れた合成データ生成のためのニューラルレンダリングの改善によりアップグレードされました。
これらの高度なモデルとシミュレーションをサポートするために、NVIDIAはロボット工学ワークフロー専用に構築されたインフラストラクチャを導入しました。RTX Pro Blackwellサーバーは、ロボット開発におけるシミュレーション、トレーニング、および推論の要求の厳しいタスクに最適化された統一アーキテクチャを提供します。さらに、DGX Cloudは、物理AIワークフローを管理するためのスケーラブルなクラウドベースのソリューションを提供し、チームがどこからでもAIエージェントをリモートで開発、トレーニング、および展開できるようにします。
業界はこれらのイノベーションの可能性を迅速に認識しています。Amazon Devices、Agility Robotics、Figure AI、Uber、Boston Dynamicsなどの主要企業は、すでにCosmosモデルとOmniverseツールの試験運用を行っています。彼らはこれらの技術を活用して、重要なトレーニングデータを生成し、デジタルツインを構築し、製造、輸送、ロジスティクス分野におけるロボット工学の展開を加速しています。NVIDIAは、CosmosモデルをAPIおよび開発者カタログを通じて広く利用可能にし、研究および商業アプリケーションの両方をサポートする許容ライセンスを提供しています。
NVIDIAのビジョンは明確です。物理AIは、包括的でフルスタックの課題を表しています。よりスマートなモデル、より豊富なシミュレーション機能、およびスケーラブルなインフラストラクチャを提供することにより、NVIDIAは仮想トレーニングと実世界展開の間の重要なギャップを埋めることを目指しています。この統合されたアプローチは、ロボット開発における費用のかかる試行錯誤を大幅に削減し、インテリジェントエージェントとロボットに前例のないレベルの自律性をもたらすことを約束します。