Nvidia propulse l'IA Physique avec le nouveau matériel Blackwell et des modèles d'IA
Lors du SIGGRAPH 2025, Nvidia a dévoilé une vision globale de ce qu’il appelle l’“IA Physique”, une convergence stratégique de l’intelligence artificielle et de l’infographie visant à permettre aux systèmes d’interagir intelligemment avec le monde réel. Cette initiative ambitieuse englobe tout, de la robotique avancée et des véhicules autonomes aux infrastructures intelligentes, bâtie sur une fondation de nouveau matériel, de plateformes de simulation sophistiquées et de modèles d’IA de pointe.
“L’IA fait progresser nos capacités de simulation, et nos capacités de simulation font progresser les systèmes d’IA”, a expliqué Sanja Fidler, vice-présidente de la recherche en IA chez Nvidia, soulignant la relation symbiotique au cœur de cette stratégie. L’écosystème complet de l’entreprise est conçu pour fournir la puissance de calcul et l’intelligence nécessaires à ces applications du monde réel.
Au centre de l’initiative de Nvidia se trouvent les nouvelles offres matérielles basées sur l’architecture Blackwell, adaptées aux charges de travail d’IA exigeantes. Pour les centres de données, le GPU Nvidia RTX PRO 6000 Blackwell Server Edition est destiné à s’intégrer dans les serveurs d’entreprise grand public, tirant parti du format 2U largement adopté. Les principaux partenaires système, notamment Cisco, Dell Technologies, HPE, Lenovo et Supermicro, sont sur le point de proposer ces serveurs. Nvidia affirme que ces systèmes représentent un bond significatif des architectures traditionnelles basées sur les CPU vers des plateformes de calcul accéléré, affichant des performances jusqu’à 45 fois supérieures et une efficacité énergétique 18 fois meilleure par rapport aux configurations basées uniquement sur CPU. Les nouveaux GPU intègrent des Tensor Cores de cinquième génération qui prennent en charge le format FP4, une innovation clé qui, selon Nvidia, multiplie par six les performances d’inférence par rapport au GPU L40S de la génération précédente.
Pour le segment des ordinateurs de bureau, Nvidia a introduit deux cartes graphiques compactes : la Nvidia RTX PRO 4000 SFF Edition et la RTX PRO 2000 Blackwell. Ces cartes sont conçues pour apporter l’accélération de l’IA aux stations de travail plus petites et plus économes en énergie, s’adressant aux professionnels dans des domaines tels que l’ingénierie, la conception et la visualisation 3D. La RTX PRO 4000 SFF offrirait jusqu’à 2,5 fois plus de performances d’IA avec la même consommation d’énergie de 70 watts que son prédécesseur, tandis que la RTX PRO 2000 offrirait des performances 1,4 fois plus rapides en conception assistée par ordinateur (CAO), entre autres améliorations. Les deux nouveaux GPU devraient être disponibles plus tard cette année.
Ce nouveau matériel puissant constitue l’épine dorsale informatique de la vision de l’IA Physique de Nvidia, en particulier son accent sur la simulation. L’idée centrale est de créer des jumeaux numériques très réalistes et physiquement précis où les systèmes d’IA, tels que les robots, peuvent apprendre en toute sécurité par essais et erreurs étendus avant leur déploiement dans le monde physique. “L’infographie et l’IA convergent pour transformer fondamentalement la robotique”, a affirmé Rev Lebaredian, vice-président d’Omniverse et des technologies de simulation chez Nvidia.
Le fondement technologique de cette approche axée sur la simulation est constitué des plateformes Nvidia Omniverse et Isaac. Nvidia a annoncé de nouvelles bibliothèques logicielles pour Omniverse, y compris Omniverse NuRec, qui facilite la reconstruction d’environnements du monde réel à partir de données de capteurs en utilisant des techniques avancées de splatting gaussien 3D. De plus, les applications de simulation robotique Isaac Sim 5.0 et Isaac Lab 2.2 sont désormais disponibles en tant que projets open source sur GitHub, intégrant ces nouvelles capacités de rendu.
Une application concrète et convaincante de cette stratégie de simulation d’abord provient d’Amazon Devices & Services pour son processus de fabrication “zéro-touch”. Ici, les modèles CAO de nouveaux produits sont importés dans Nvidia Isaac Sim pour générer plus de 50 000 images synthétiques. Ces images sont ensuite utilisées pour entraîner des modèles d’IA qui contrôlent les bras robotiques, leur permettant d’effectuer de manière autonome des contrôles qualité ou d’intégrer de nouveaux produits dans la ligne de production. L’ensemble de ce processus repose uniquement sur des compétences acquises en simulation, éliminant le besoin de modifications matérielles physiques. Des technologies comme le modèle d’estimation de pose FoundationPose permettent en outre à ces robots de reconnaître même des objets inédits sans formation préalable.
Pour s’assurer que les systèmes d’IA peuvent non seulement percevoir mais aussi raisonner efficacement, Nvidia a élargi ses familles de modèles d’IA. Pour les applications d’entreprise, la famille Nemotron inclut désormais Nemotron Nano 2 et Llama Nemotron Super 1.5. Ces modèles sont conçus pour permettre aux agents d’IA de s’attaquer à des tâches complexes en plusieurs étapes dans des secteurs tels que le service client et la cybersécurité. Nvidia souligne la haute efficacité des modèles, obtenue grâce à une architecture hybride et à la quantification (NVFP4). Des entreprises telles que CrowdStrike, Uber et Zoom seraient déjà en train de tester ou de planifier l’intégration de ces modèles.
Développé spécifiquement pour l’IA Physique, Cosmos Reason est un modèle de langage visuel (VLM) personnalisable de 7 milliards de paramètres. Ce modèle est conçu pour permettre aux robots et aux agents d’IA visuelle d’interpréter et d’agir dans le monde physique en intégrant des connaissances antérieures, une compréhension de la physique et du “bon sens”. Ses applications couvrent la planification de robots, l’annotation automatisée de données d’entraînement et l’analyse vidéo. Uber, par exemple, utilise Cosmos Reason pour analyser le comportement des véhicules autonomes, tandis que VAST Data et Milestone Systems l’emploient pour la surveillance intelligente du trafic.
Pour traduire ces technologies avancées en applications tangibles pour les infrastructures intelligentes, Nvidia intègre de nombreux composants dans sa plateforme Metropolis. La plateforme a été améliorée avec plusieurs nouvelles fonctionnalités, y compris l’intégration transparente du VLM Cosmos Reason, de nouveaux modèles de base de vision au sein du TAO Toolkit, et des extensions pour Isaac Sim afin de générer des scénarios d’entraînement rares. Les partenaires exploitent déjà Metropolis pour diverses solutions. Accenture et Belden développent des “clôtures virtuelles intelligentes”, simulées dans Omniverse, pour améliorer la sécurité des travailleurs autour des robots industriels. DeepHow utilise le plan Metropolis VSS pour un “Compagnon de Savoir Intelligent” qui transforme les instructions de travail en guides visuels, une solution que Anheuser-Busch InBev aurait utilisée pour réduire le temps d’intégration des nouveaux employés de 80 %.
L’initiative “IA Physique” de Nvidia représente un effort complet pour combler le fossé entre la simulation numérique et l’intelligence du monde réel, promettant un avenir où les machines apprendront et agiront avec une autonomie et une compréhension sans précédent.