Nvidias neue Blackwell GPUs: KI-Power für kompakte Workstations
Nvidia hat zwei neue kompakte Blackwell-Architektur-GPUs vorgestellt, die RTX Pro 4000 Small Form Factor (SFF) und die RTX Pro 2000, die entwickelt wurden, um hohe Leistung für professionelle Visualisierungs- und lokale KI-Workloads innerhalb eines strengen 70-Watt-Leistungsrahmens zu liefern. Beide Karten wurden auf der Siggraph-Konferenz in Vancouver, British Columbia, enthüllt und teilen ein halbhohes Dual-Slot-Kühlerdesign, wodurch sie sich für Workstations mit begrenztem Platz eignen.
Trotz ihrer ähnlichen physischen Profile bedienen die beiden Karten unterschiedliche Leistungsstufen. Die RTX Pro 4000 SFF verfügt über eine deutlich höhere Rechenleistung mit 8.960 CUDA-Kernen, mehr als doppelt so viele wie die 4.352 Kerne der RTX Pro 2000. Nvidia behauptet, die RTX Pro 4000 SFF biete einen erheblichen Leistungssprung gegenüber ihren Vorgängern, mit etwa 1,7-mal schnelleren Raytracing-Fähigkeiten und 2,5-mal höherer KI-Leistung. Ausgestattet mit 280 Tensor-Kernen, spezialisierten Prozessoren für KI, kann der Chip bis zu 770 TeraFLOPS FP4-Leistung liefern. Während dies eine 2,51-fache Verbesserung der Gleitkomma-Mathematik darstellt, ist es wichtig zu beachten, dass ein Großteil dieses Gewinns auf die Umstellung auf FP4-Präzision (4-Bit-Gleitkommazahl) und nicht auf rein architektonische Verbesserungen zurückzuführen ist; bei Normalisierung auf FP8 (8-Bit-Gleitkommazahl) liegt die Geschwindigkeitssteigerung des Chips näher bei 25 Prozent.
Wo die RTX Pro 4000 SFF wirklich glänzt, ist die Speicherbandbreite, ein entscheidender Faktor für die lokale KI-Inferenz, insbesondere bei großen Sprachmodellen (LLMs). Mit 24 GB GDDR7-Speicher, der 432 GB/s Bandbreite bietet, wird prognostiziert, dass die Karte Tokens in LLMs etwa 54 Prozent schneller generiert als Nvidias frühere Angebote.
Die RTX Pro 2000, obwohl weniger leistungsstark als ihr Geschwistermodell, verspricht dennoch eine bemerkenswerte Leistungssteigerung für professionelle Visualisierungsaufgaben, trotz ihres bescheidenen 70-W-Stromverbrauchs. Nvidia gibt an, dass Benutzer eine 1,6-fache Verbesserung bei der 3D-Modellierung, eine 1,4-mal höhere Leistung im Computer-Aided Design (CAD) und ein 1,6-mal schnelleres Rendering im Vergleich zu ihrem Ada Generation-Vorgänger erwarten können. Für KI-Workloads ist die RTX Pro 2000, obwohl sie nicht mit ihren leistungsstärkeren Gegenstücken mithalten kann, weit davon entfernt, langsam zu sein, und bietet bis zu 545 TeraFLOPS an spärlicher FP4-Rechenleistung und 280 GB/s Speicherbandbreite, gespeist durch 16 GB GDDR7-Speicher.
Diese neuen kompakten GPUs ergänzen Nvidias bestehende Blackwell-Workstation-Produktreihe, zu der auch die 96 GB RTX Pro 6000 gehört, die auf der GTC-Konferenz im März angekündigt wurde. Darüber hinaus präsentierte Nvidia auf der Siggraph auch eine 2U-Serverplattform, die ein Paar 600W RTX Pro 6000 Server Edition-Karten aufnehmen kann, die jeweils bis zu 4 PetaFLOPS an spärlicher FP4-Leistung liefern. Die RTX Pro 4000 SFF und RTX Pro 2000 werden später in diesem Jahr über die Distributoren PNY und TD SYNNEX erhältlich sein und auch in OEM-Systeme von Herstellern wie BOXX, Dell, HP und Lenovo integriert. Die Serversysteme mit den leistungsstärkeren RTX Pro 6000 Server-Karten sind bereits von Cisco, Dell, HPE, Lenovo und Supermicro und anderen erhältlich.