Les nouvelles GPUs Blackwell de Nvidia boostent les stations de travail IA compactes

Theregister

Nvidia a introduit deux nouvelles GPUs compactes basées sur l’architecture Blackwell, la RTX Pro 4000 Small Form Factor (SFF) et la RTX Pro 2000, conçues pour offrir des performances élevées pour la visualisation professionnelle et les charges de travail d’IA locales, le tout dans une enveloppe de puissance stricte de 70 watts. Dévoilées lors de la conférence Siggraph à Vancouver, en Colombie-Britannique, les deux cartes partagent un design de refroidisseur demi-hauteur à double slot, ce qui les rend adaptées aux stations de travail à espace contraint.

Malgré leurs profils physiques similaires, les deux cartes s’adressent à différents niveaux de performance. La RTX Pro 4000 SFF bénéficie d’une puissance de traitement nettement supérieure, avec 8 960 cœurs CUDA, soit plus du double des 4 352 cœurs de la RTX Pro 2000. Nvidia affirme que la RTX Pro 4000 SFF offre un bond de performance substantiel par rapport à ses prédécesseurs, atteignant des capacités de ray tracing environ 1,7 fois plus rapides et des performances d’IA 2,5 fois plus élevées. Équipée de 280 cœurs Tensor, processeurs spécialisés pour l’IA, la puce peut fournir jusqu’à 770 téraFLOPS de performances FP4. Bien que cela représente une amélioration de 2,51x en calcul en virgule flottante, il est important de noter qu’une grande partie de ce gain provient du passage à la précision FP4 (virgule flottante 4 bits) plutôt que de pures améliorations architecturales ; lorsqu’elle est normalisée à FP8 (virgule flottante 8 bits), l’augmentation de vitesse de la puce est plus proche de 25 pour cent.

Là où la RTX Pro 4000 SFF brille vraiment, c’est dans la bande passante mémoire, un facteur critique pour l’inférence d’IA locale, en particulier avec les grands modèles de langage (LLM). Avec 24 Go de mémoire GDDR7 offrant 432 Go/s de bande passante, la carte devrait générer des tokens dans les LLM environ 54 % plus rapidement que les offres précédentes de Nvidia.

La RTX Pro 2000, bien que moins puissante que sa sœur, promet néanmoins une amélioration notable des performances pour les tâches de visualisation professionnelle, malgré sa consommation électrique modeste de 70W. Nvidia indique que les utilisateurs peuvent s’attendre à une amélioration de 1,6 fois en modélisation 3D, des performances 1,4 fois plus élevées en conception assistée par ordinateur (CAO) et un rendu 1,6 fois plus rapide par rapport à son prédécesseur de la génération Ada. Pour les charges de travail d’IA, la RTX Pro 2000, bien que n’étant pas à la hauteur de ses homologues plus gourmands en énergie, est loin d’être un poids lourd, offrant jusqu’à 545 téraFLOPS de calcul FP4 clairsemé et 280 Go/s de bande passante mémoire, alimentée par 16 Go de mémoire GDDR7.

Ces nouvelles GPUs compactes complètent la gamme existante de stations de travail Blackwell de Nvidia, qui inclut la RTX Pro 6000 de 96 Go annoncée lors de la conférence GTC en mars. De plus, à Siggraph, Nvidia a également présenté une plateforme serveur 2U capable d’accueillir une paire de cartes RTX Pro 6000 Server edition de 600W, chacune offrant jusqu’à 4 pétaFLOPS de performances FP4 clairsemées. Les RTX Pro 4000 SFF et RTX Pro 2000 seront disponibles plus tard cette année auprès des distributeurs PNY et TD SYNNEX, et seront également intégrées dans les systèmes OEM de fabricants tels que BOXX, Dell, HP et Lenovo. Les systèmes serveurs, dotés des cartes RTX Pro 6000 Server plus puissantes, sont déjà disponibles auprès de Cisco, Dell, HPE, Lenovo et Supermicro, entre autres.