NVIDIA Blackwell : GPUs et Serveurs Révolutionnent l'IA d'Entreprise et la Robotique
NVIDIA est sur le point d’étendre considérablement la portée de sa plateforme de calcul accéléré, annonçant que sa nouvelle GPU RTX PRO 6000 Blackwell Server Edition sera bientôt intégrée dans les serveurs d’entreprise des principaux fournisseurs. Cisco, Dell Technologies, HPE, Lenovo et Supermicro proposeront diverses configurations de ces puissantes GPUs au sein de leurs gammes de serveurs 2U. Ce déploiement vise à offrir des gains substantiels de performance et d’efficacité à travers un éventail d’applications exigeantes, y compris l’entraînement avancé de modèles d’IA, le rendu graphique sophistiqué, les simulations complexes, l’analyse de données et les opérations industrielles critiques.
Selon Jensen Huang, fondateur et PDG de NVIDIA, l’intelligence artificielle est en train d’instiguer un changement fondamental dans l’informatique, une transformation jamais vue en soixante ans. Ce qui a commencé comme un phénomène centré sur le cloud est maintenant en train de remodeler l’architecture même des centres de données sur site. Avec le soutien des principaux fabricants de serveurs, NVIDIA entend que ses serveurs Blackwell RTX PRO deviennent la plateforme standard pour les charges de travail d’IA d’entreprise et industrielles.
Alors que des millions de serveurs vendus annuellement pour les opérations commerciales reposent encore majoritairement sur des CPU traditionnels, l’introduction des serveurs RTX PRO marque un tournant décisif vers l’accélération GPU pour les charges de travail commerciales courantes. NVIDIA affirme que ces nouvelles GPUs Server Edition peuvent offrir jusqu’à 45 fois de meilleures performances et 18 fois une efficacité énergétique supérieure par rapport aux systèmes basés uniquement sur CPU, augmentant considérablement les capacités en matière d’analyse, de simulations, de traitement vidéo et de rendu. La gamme RTX PRO est spécifiquement conçue pour les entreprises qui établissent des “usines d’IA”, où les contraintes d’espace, de puissance et de refroidissement sont primordiales. Ces serveurs constituent également l’infrastructure fondamentale de la plateforme de données d’IA de NVIDIA, supportant les systèmes de stockage avancés. Par exemple, Dell met à jour sa plateforme de données d’IA pour tirer parti de l’architecture de NVIDIA, avec ses serveurs PowerEdge R7725 dotés de deux GPUs RTX PRO 6000, du logiciel NVIDIA AI Enterprise et d’un réseau NVIDIA intégré. Ces nouveaux serveurs 2U, capables d’accueillir jusqu’à huit unités GPU, ont été initialement dévoilés à COMPUTEX en mai.
Au cœur de ces nouveaux serveurs se trouve l’architecture Blackwell avancée de NVIDIA. Les caractéristiques clés incluent des Tensor Cores de cinquième génération et un Transformer Engine de deuxième génération qui, avec une précision FP4, peut exécuter des tâches d’inférence d’IA jusqu’à six fois plus rapidement que la GPU L40S précédente. Pour le calcul visuel, la technologie RTX de quatrième génération offre jusqu’à quatre fois les performances de la GPU L40S en rendu photo. L’architecture intègre également de robustes capacités de virtualisation et la technologie NVIDIA Multi-Instance GPU, permettant à chaque GPU de gérer jusqu’à quatre charges de travail distinctes simultanément. De plus, l’amélioration de l’efficacité énergétique contribue à réduire la consommation globale d’énergie des centres de données.
Au-delà des applications d’entreprise traditionnelles, les serveurs RTX PRO sont conçus pour alimenter l’IA physique et la robotique. Les bibliothèques Omniverse de NVIDIA et les modèles de fondation du monde Cosmos, fonctionnant sur ces serveurs, facilitent les simulations complexes de jumeaux numériques, les routines d’entraînement de robots sophistiquées et la création de données synthétiques à grande échelle. Ils prennent également en charge les plans NVIDIA Metropolis, permettant la recherche et la synthèse vidéo avancées, ainsi que les modèles de langage de vision cruciaux pour les environnements physiques du monde réel. NVIDIA a amélioré ses offres Omniverse et Cosmos avec de nouveaux SDK Omniverse et une compatibilité étendue avec MuJoCo (MJCF) et Universal Scene Description (OpenUSD), ouvrant potentiellement les capacités de simulation de robots à plus de 250 000 développeurs MJCF. Les nouvelles bibliothèques Omniverse NuRec introduisent le splatting gaussien 3D ray-tracé pour la construction de modèles à partir de données de capteurs, tandis que les frameworks mis à jour Isaac Sim 5.0 et Isaac Lab 2.2, disponibles sur GitHub, ajoutent le rendu neural et de nouveaux schémas basés sur OpenUSD pour les robots et les capteurs. Le rendu NuRec est déjà intégré dans le simulateur de véhicules autonomes CARLA et adopté par des entreprises comme Foretellix pour générer des données de test AV synthétiques. Le moteur de données FiftyOne de Voxel51, utilisé par des constructeurs automobiles tels que Ford et Porsche, prend désormais également en charge NuRec. Parmi les adopteurs notables de ces bibliothèques et frameworks figurent Boston Dynamics, Figure AI, Hexagon et Amazon Devices & Services.
Les modèles de fondation du monde Cosmos (WFMs) ont été téléchargés plus de deux millions de fois, principalement pour faciliter la génération de données d’entraînement synthétiques pour les robots à l’aide d’invites textuelles, d’images ou de vidéos. Le nouveau modèle Cosmos Transfer-2 accélère considérablement la génération de données d’image à partir de scènes de simulation et d’entrées spatiales comme les cartes de profondeur, et des entreprises telles que Lightwheel, Moon Surgical et Skild AI l’exploitent déjà pour la production de données d’entraînement à grande échelle. NVIDIA a également introduit Cosmos Reason, un modèle de langage visuel de 7 milliards de paramètres conçu pour autonomiser les robots et les agents d’IA en intégrant les connaissances antérieures à une compréhension de la physique. Ce modèle peut automatiser la curation de jeux de données, prendre en charge la planification de tâches robotiques multi-étapes et améliorer les systèmes d’analyse vidéo. Les propres équipes de robotique et DRIVE de NVIDIA utilisent Cosmos Reason pour le filtrage et l’annotation des données, tandis qu’Uber et Magna l’ont déployé dans des véhicules autonomes, la surveillance du trafic et les systèmes d’inspection industrielle.
Pour les déploiements d’agents d’IA à grande échelle, les serveurs RTX PRO sont capables d’exécuter le modèle Llama Nemotron Super, récemment annoncé. Lors de l’opération avec une précision NVFP4 sur une seule GPU RTX PRO 6000, ces serveurs offrent jusqu’à trois fois un meilleur rapport prix-performance par rapport à l’utilisation de la précision FP8 sur les GPUs H100 de NVIDIA, soulignant leur efficacité pour les charges de travail d’IA exigeantes.