Nvidia Dévoile l'IA Agéntique & des Modèles de Robotique Physique, Dopant la Précision

Aibusiness

Nvidia a dévoilé des avancées significatives dans le domaine de l’intelligence artificielle, introduisant de nouvelles capacités d’IA agéntique et des modèles révolutionnaires de robotique physique. Ces développements, annoncés à SIGGRAPH 2025, marquent un moment pivot dans l’engagement de l’entreprise à permettre des systèmes d’IA capables de raisonner, de planifier et d’interagir avec le monde physique.

Au cœur de la dernière poussée de Nvidia se trouve l’« IA agéntique », un changement de paradigme vers des systèmes d’IA qui possèdent des capacités sophistiquées de raisonnement et de planification itérative, leur permettant de s’attaquer de manière autonome à des problèmes complexes en plusieurs étapes. Cela va au-delà des chatbots IA traditionnels, permettant aux systèmes d’analyser les défis, d’élaborer des stratégies et d’exécuter des tâches de manière indépendante, promettant une productivité et une efficacité opérationnelle accrues dans diverses industries. Nvidia étend ses familles de modèles Nemotron et Cosmos pour alimenter ces agents IA plus intelligents, avec de nouveaux modèles comme Nemotron Nano 2 et Llama Nemotron Super 1.5 offrant une précision et une efficacité de raisonnement améliorées pour les applications d’entreprise. Ces modèles sont conçus pour servir de « cerveau » aux agents IA, fournissant l’intelligence essentielle nécessaire aux flux de travail complexes et aux interactions dans le monde réel.

Un point fort majeur de l’annonce de Nvidia est le progrès substantiel en matière d’« IA physique », qui se concentre sur l’autonomisation des systèmes d’IA pour percevoir, raisonner, planifier et agir dans des environnements du monde réel. Cette initiative est particulièrement impactante pour les domaines en évolution rapide de la robotique et des systèmes autonomes. Au centre de cette avancée se trouve Cosmos Reason, un modèle vision-langage (VLM) de raisonnement de 7 milliards de paramètres récemment introduit. Conçu spécifiquement pour les robots et les agents IA de vision, Cosmos Reason permet à ces machines de comprendre des instructions complexes et de planifier des actions en intégrant la mémoire, la compréhension de la physique et le bon sens tirés des données d’entraînement. Cela permet aux robots de « raisonner » sur ce qu’ils voient et de déterminer les étapes nécessaires pour qu’un agent incarné les prenne, ce qui le rend inestimable pour des tâches telles que la curation de données, la planification de robots et l’analyse vidéo.

Nvidia souligne que Cosmos Reason est entraîné en utilisant une combinaison de réglage fin supervisé et d’apprentissage par renforcement, une méthodologie qui a démontré des améliorations notables des performances sur les principaux benchmarks de robotique et de conduite autonome. La société rapporte qu’après l’entraînement, les performances du modèle sur les tâches d’IA physique s’améliorent de plus de 10 %, l’apprentissage par renforcement contribuant à 5 % supplémentaires, atteignant un score moyen de 65,7 sur ces benchmarks.

Ces avancées ne sont pas isolées; elles font partie d’un écosystème complet conçu pour accélérer le développement et le déploiement de solutions d’IA physique. Nvidia déploie de nouvelles bibliothèques Omniverse, y compris celles pour le splatting gaussien 3D pour la reconstruction de mondes à grande échelle, et met à jour ses plateformes Isaac Sim et Isaac Lab pour une simulation robotique robuste. Ces outils permettent aux développeurs de créer des jumeaux numériques physiquement précis et de générer des données synthétiques, essentiels pour entraîner en toute sécurité les systèmes d’IA par essais et erreurs avant un déploiement réel. De plus, Nvidia renforce son infrastructure avec de nouveaux serveurs RTX Pro alimentés par Blackwell, spécialement conçus pour gérer les exigences computationnelles intenses de ces charges de travail IA avancées. Ces serveurs, disponibles dans diverses configurations via des partenariats avec des fournisseurs de premier plan comme HPE, visent à rendre l’inférence IA haute performance accessible aux applications d’entreprise et industrielles.

Les annonces de SIGGRAPH 2025 soulignent la convergence croissante de l’intelligence artificielle et de l’infographie, Nvidia se positionnant à l’avant-garde de cette transformation. En permettant aux agents IA de raisonner plus intelligemment et en fournissant des outils robustes pour l’entraînement de l’IA physique, Nvidia jette les bases d’un avenir où les machines intelligentes pourront comprendre et opérer de manière transparente dans notre monde physique complexe.