Nvidia、エージェントAIと物理ロボットモデルを発表、トレーニング精度を向上

Aibusiness

Nvidiaは、人工知能の分野で重要な進歩を遂げ、新しいエージェントAI機能と画期的な物理ロボットモデルを発表しました。SIGGRAPH 2025で発表されたこれらの開発は、推論し、計画し、物理世界と相互作用できるAIシステムを実現するという同社のコミットメントにおける極めて重要な瞬間を示しています。

Nvidiaの最新の取り組みの中核にあるのは、「エージェントAI」です。これは、洗練された推論と反復的な計画能力を持つAIシステムへのパラダイムシフトであり、複雑な多段階の問題を自律的に解決することを可能にします。これは従来のAIチャットボットを超越し、システムが課題を分析し、戦略を考案し、タスクを独立して実行できるようにすることで、さまざまな業界での生産性と運用効率の向上を約束します。Nvidiaは、これらのよりスマートなAIエージェントを強化するためにNemotronおよびCosmosモデルファミリーを拡張しており、Nemotron Nano 2やLlama Nemotron Super 1.5などの新しいモデルは、企業アプリケーション向けに推論精度と効率を向上させています。これらのモデルは、AIエージェントの「脳」として機能し、複雑なワークフローや現実世界での相互作用に必要な中核的な知能を提供するように設計されています。

Nvidiaの発表の主要なハイライトは、「物理AI」における実質的な進歩です。これは、AIシステムが現実世界の環境で認識し、推論し、計画し、行動できるようにすることに焦点を当てています。この取り組みは、急速に進化するロボット工学と自律システム分野にとって特に影響力があります。この進歩の中心となるのは、新しく導入された70億パラメータの推論視覚言語モデル(VLM)であるCosmos Reasonです。ロボットや視覚AIエージェント向けに特別に設計されたCosmos Reasonは、記憶、物理的理解、トレーニングデータから得られた常識を統合することで、これらのマシンが複雑な指示を理解し、行動を計画できるようにします。これにより、ロボットは自分が見ているものについて「推論」し、具現化されたエージェントが取るべき必要なステップを決定できるようになり、データキュレーション、ロボット計画、ビデオ分析などのタスクにとって非常に貴重なものとなります。

Nvidiaは、Cosmos Reasonが教師ありファインチューニングと強化学習の組み合わせを使用してトレーニングされていることを強調しています。この方法は、主要なロボット工学および自動運転のベンチマークで顕著な性能向上を示しています。同社は、トレーニング後、物理AIタスクにおけるモデルの性能が10%以上向上し、強化学習がさらに5%貢献して、これらのベンチマークで平均スコア65.7を達成したと報告しています。

これらの進歩は孤立したものではなく、物理AIソリューションの開発と展開を加速するように設計された包括的なエコシステムの一部です。Nvidiaは、大規模な世界再構築のための3Dガウスプラッティングを含む新しいOmniverseライブラリを展開し、堅牢なロボットシミュレーションのためにIsaac SimおよびIsaac Labプラットフォームを更新しています。これらのツールにより、開発者は物理的に正確なデジタルツインを作成し、合成データを生成できます。これは、現実世界に展開する前に試行錯誤を通じてAIシステムを安全にトレーニングするために不可欠です。さらに、Nvidiaは、これらの高度なAIワークロードの集中的な計算要求を処理するために特別に設計された、新しいBlackwell搭載RTX Proサーバーでインフラストラクチャを強化しています。これらのサーバーは、HPEなどの主要プロバイダーとの提携を通じてさまざまな構成で利用可能であり、企業および産業アプリケーション向けに高性能AI推論をアクセス可能にすることを目指しています。

SIGGRAPH 2025での発表は、人工知能とコンピューターグラフィックスの収束がますます進んでいることを強調しており、Nvidiaはこの変革の最前線に位置しています。AIエージェントがよりインテリジェントに推論できるようにし、物理AIトレーニングのための堅牢なツールを提供することで、Nvidiaは、インテリジェントなマシンが私たちの複雑な物理世界をシームレスに理解し、操作できる未来の基礎を築いています。