Nvidia boostet 'Physische KI' mit Blackwell-Hardware & KI-Modellen
Auf der SIGGRAPH 2025 enthüllte Nvidia eine umfassende Vision dessen, was es als „Physische KI“ bezeichnet – eine strategische Konvergenz von künstlicher Intelligenz und Computergrafik, die darauf abzielt, Systemen die intelligente Interaktion mit der realen Welt zu ermöglichen. Diese ehrgeizige Initiative umfasst alles von fortschrittlicher Robotik und autonomen Fahrzeugen bis hin zu intelligenter Infrastruktur, aufgebaut auf einer Grundlage aus neuer Hardware, hochentwickelten Simulationsplattformen und modernsten KI-Modellen.
„KI verbessert unsere Simulationsfähigkeiten, und unsere Simulationsfähigkeiten treiben KI-Systeme voran“, erklärte Sanja Fidler, Nvidias Vice President of AI Research, und unterstrich damit die symbiotische Beziehung, die das Herzstück dieser Strategie bildet. Das umfassende Ökosystem des Unternehmens ist darauf ausgelegt, die Rechenleistung und Intelligenz zu liefern, die für diese realen Anwendungen erforderlich ist.
Im Mittelpunkt von Nvidias Vorstoß stehen neue Hardware-Angebote, die auf der Blackwell-Architektur basieren und auf anspruchsvolle KI-Workloads zugeschnitten sind. Für Rechenzentren wird die Nvidia RTX PRO 6000 Blackwell Server Edition GPU in gängige Enterprise-Server integriert und nutzt den weit verbreiteten 2U-Formfaktor. Wichtige Systempartner, darunter Cisco, Dell Technologies, HPE, Lenovo und Supermicro, werden diese Server anbieten. Nvidia gibt an, dass diese Systeme einen bedeutenden Sprung von traditionellen CPU-basierten Architekturen zu beschleunigten Computing-Plattformen darstellen, die im Vergleich zu reinen CPU-Konfigurationen eine bis zu 45-mal höhere Leistung und eine 18-mal bessere Energieeffizienz aufweisen. Die neuen GPUs verfügen über Tensor Cores der fünften Generation, die das FP4-Format unterstützen, eine Schlüsselinnovation, die laut Nvidia die Inferenzleistung um das Sechsfache gegenüber der vorherigen Generation der L40S GPU steigert.
Für das Desktop-Segment stellte Nvidia zwei kompakte Grafikkarten vor: die Nvidia RTX PRO 4000 SFF Edition und die RTX PRO 2000 Blackwell. Diese Karten wurden entwickelt, um KI-Beschleunigung in kleinere, energieeffizientere Workstations zu bringen, die sich an Fachleute in Bereichen wie Ingenieurwesen, Design und 3D-Visualisierung richten. Die RTX PRO 4000 SFF liefert Berichten zufolge eine bis zu 2,5-mal höhere KI-Leistung bei gleicher 70-Watt-Leistungsaufnahme wie ihr Vorgänger, während die RTX PRO 2000 im Computer-Aided Design (CAD) eine 1,4-mal schnellere Leistung bieten soll, neben weiteren Verbesserungen. Beide neuen GPUs werden voraussichtlich noch in diesem Jahr verfügbar sein.
Diese leistungsstarke neue Hardware bildet das rechnerische Rückgrat für Nvidias Vision der Physischen KI, insbesondere deren Betonung der Simulation. Die Kernidee besteht darin, hochrealistische, physikalisch genaue digitale Zwillinge zu erstellen, in denen KI-Systeme, wie Roboter, sicher durch umfangreiches Ausprobieren lernen können, bevor sie in der physischen Welt eingesetzt werden. „Computergrafik und KI konvergieren, um die Robotik grundlegend zu transformieren“, bestätigte Rev Lebaredian, Vice President of Omniverse and Simulation Technologies bei Nvidia.
Das technologische Fundament für diesen simulationsbasierten Ansatz bilden die Nvidia Omniverse- und Isaac-Plattformen. Nvidia kündigte neue Softwarebibliotheken für Omniverse an, darunter Omniverse NuRec, das die Rekonstruktion realer Umgebungen aus Sensordaten mithilfe fortschrittlicher 3D-Gaussian-Splatting-Techniken erleichtert. Darüber hinaus sind die Robotik-Simulationsanwendungen Isaac Sim 5.0 und Isaac Lab 2.2 nun als Open-Source-Projekte auf GitHub verfügbar und enthalten diese neuen Rendering-Funktionen.
Eine überzeugende reale Anwendung dieser simulationsbasierten Strategie kommt von Amazon Devices & Services für ihren „Zero-Touch“-Fertigungsprozess. Hier werden CAD-Modelle neuer Produkte in Nvidia Isaac Sim importiert, um über 50.000 synthetische Bilder zu generieren. Diese Bilder werden dann verwendet, um KI-Modelle zu trainieren, die Roboterarme steuern, sodass diese autonom Qualitätskontrollen durchführen oder neue Produkte in die Produktionslinie integrieren können. Dieser gesamte Prozess basiert ausschließlich auf in der Simulation erlernten Fähigkeiten, wodurch physische Hardware-Modifikationen überflüssig werden. Technologien wie das FoundationPose-Posenschätzungsmodell befähigen diese Roboter zusätzlich, auch neuartige Objekte ohne vorheriges Training zu erkennen.
Um sicherzustellen, dass KI-Systeme nicht nur wahrnehmen, sondern auch effektiv argumentieren können, hat Nvidia seine KI-Modellfamilien erweitert. Für Unternehmensanwendungen umfasst die Nemotron-Familie nun Nemotron Nano 2 und Llama Nemotron Super 1.5. Diese Modelle wurden entwickelt, um KI-Agenten zu ermöglichen, komplexe, mehrstufige Aufgaben in Bereichen wie Kundenservice und Cybersicherheit zu bewältigen. Nvidia hebt die hohe Effizienz der Modelle hervor, die durch eine hybride Architektur und Quantisierung (NVFP4) erreicht wird. Unternehmen wie CrowdStrike, Uber und Zoom testen oder planen Berichten zufolge bereits die Integration dieser Modelle.
Speziell für die Physische KI wurde Cosmos Reason entwickelt, ein anpassbares Vision Language Model (VLM) mit 7 Milliarden Parametern. Dieses Modell wurde entwickelt, um Roboter und visuelle KI-Agenten zu befähigen, die physische Welt zu interpretieren und in ihr zu handeln, indem es Vorwissen, ein Verständnis der Physik und „gesunden Menschenverstand“ integriert. Seine Anwendungen umfassen Roboterplanung, die automatisierte Annotation von Trainingsdaten und Videoanalysen. Uber beispielsweise nutzt Cosmos Reason zur Analyse des Verhaltens autonomer Fahrzeuge, während VAST Data und Milestone Systems es für die intelligente Verkehrsüberwachung einsetzen.
Um diese fortschrittlichen Technologien in greifbare Anwendungen für intelligente Infrastrukturen zu übersetzen, integriert Nvidia viele dieser Komponenten in seine Metropolis-Plattform. Die Plattform wurde um mehrere neue Funktionen erweitert, darunter die nahtlose Integration des Cosmos Reason VLM, neue Vision-Foundation-Modelle innerhalb des TAO Toolkits und Erweiterungen für Isaac Sim zur Generierung seltener Trainingsszenarien. Partner nutzen Metropolis bereits für vielfältige Lösungen. Accenture und Belden entwickeln „intelligente virtuelle Zäune“, die in Omniverse simuliert werden, um die Arbeitssicherheit rund um Industrieroboter zu verbessern. DeepHow verwendet das Metropolis VSS-Blueprint für einen „Smart Know-How Companion“, der Arbeitsanweisungen in visuelle Anleitungen umwandelt – eine Lösung, die Anheuser-Busch InBev Berichten zufolge nutzte, um die Einarbeitungszeit für neue Mitarbeiter um 80 Prozent zu verkürzen.
Nvidias „Physische KI“-Initiative stellt einen umfassenden Versuch dar, die Lücke zwischen digitaler Simulation und realer Intelligenz zu schließen, und verspricht eine Zukunft, in der Maschinen mit beispielloser Autonomie und Verständnis lernen und handeln.