Nvidia präsentiert Agenten-KI & Roboter-Modelle, verbessert Training

Aibusiness

Nvidia hat bedeutende Fortschritte im Bereich der künstlichen Intelligenz vorgestellt, indem es neue Agenten-KI-Fähigkeiten und bahnbrechende physische Robotikmodelle eingeführt hat. Diese Entwicklungen, die auf der SIGGRAPH 2025 angekündigt wurden, markieren einen entscheidenden Moment im Engagement des Unternehmens, KI-Systeme zu ermöglichen, die in der physischen Welt argumentieren, planen und interagieren können.

Im Mittelpunkt von Nvidias jüngstem Vorstoß steht die „Agenten-KI“, ein Paradigmenwechsel hin zu KI-Systemen, die über ausgefeilte Denk- und iterative Planungsfähigkeiten verfügen, wodurch sie komplexe, mehrstufige Probleme autonom lösen können. Dies geht über traditionelle KI-Chatbots hinaus und ermöglicht es Systemen, Herausforderungen zu analysieren, Strategien zu entwickeln und Aufgaben unabhängig auszuführen, was eine höhere Produktivität und Betriebseffizienz in verschiedenen Branchen verspricht. Nvidia erweitert seine Modellfamilien Nemotron und Cosmos, um diese intelligenteren KI-Agenten anzutreiben, wobei neue Modelle wie Nemotron Nano 2 und Llama Nemotron Super 1.5 eine verbesserte Denkgenauigkeit und Effizienz für Unternehmensanwendungen bieten. Diese Modelle sind als „Gehirn“ von KI-Agenten konzipiert und liefern die Kernintelligenz, die für komplexe Arbeitsabläufe und reale Interaktionen erforderlich ist.

Ein wichtiges Highlight der Nvidia-Ankündigung ist der substantielle Fortschritt in der „physischen KI“, die sich darauf konzentriert, KI-Systeme zu befähigen, in realen Umgebungen wahrzunehmen, zu denken, zu planen und zu handeln. Diese Initiative ist besonders wirkungsvoll für die sich schnell entwickelnden Bereiche der Robotik und autonomer Systeme. Zentral für diesen Fortschritt ist Cosmos Reason, ein neu eingeführtes 7-Milliarden-Parameter-Modell für visuelle Sprachmodelle (VLM). Speziell für Roboter und visuelle KI-Agenten entwickelt, ermöglicht Cosmos Reason diesen Maschinen, komplexe Anweisungen zu verstehen und Aktionen zu planen, indem es Gedächtnis, Physikverständnis und gesunden Menschenverstand, der aus Trainingsdaten gewonnen wurde, integriert. Dies ermöglicht es Robotern, über das, was sie sehen, zu „denken“ und die notwendigen Schritte für einen verkörperten Agenten zu bestimmen, was es für Aufgaben wie Datenkurierung, Roboterplanung und Videoanalyse von unschätzbarem Wert macht.

Nvidia betont, dass Cosmos Reason unter Verwendung einer Kombination aus überwachtem Fein-Tuning und Reinforcement Learning trainiert wird, einer Methodik, die bemerkenswerte Leistungsverbesserungen bei wichtigen Robotik- und autonomen Fahrbenchmarks gezeigt hat. Das Unternehmen berichtet, dass nach dem Training die Leistung des Modells bei physischen KI-Aufgaben um über 10 % verbessert wird, wobei das Reinforcement Learning zusätzliche 5 % beiträgt und einen Durchschnittswert von 65,7 über diese Benchmarks erreicht wird.

Diese Fortschritte sind nicht isoliert; sie sind Teil eines umfassenden Ökosystems, das die Entwicklung und Bereitstellung physischer KI-Lösungen beschleunigen soll. Nvidia führt neue Omniverse-Bibliotheken ein, darunter solche für 3D Gaussian Splatting zur großflächigen Weltrekonstruktion, und aktualisiert seine Plattformen Isaac Sim und Isaac Lab für eine robuste Robotersimulation. Diese Tools ermöglichen es Entwicklern, physikalisch genaue digitale Zwillinge zu erstellen und synthetische Daten zu generieren, was für das sichere Training von KI-Systemen durch Versuch und Irrtum vor dem realen Einsatz entscheidend ist. Darüber hinaus stärkt Nvidia seine Infrastruktur mit neuen Blackwell-betriebenen RTX Pro Servern, die speziell für die intensiven Rechenanforderungen dieser fortschrittlichen KI-Workloads entwickelt wurden. Diese Server, die in verschiedenen Konfigurationen durch Partnerschaften mit führenden Anbietern wie HPE erhältlich sind, zielen darauf ab, Hochleistungs-KI-Inferenz für Unternehmens- und Industrieanwendungen zugänglich zu machen.

Die Ankündigungen auf der SIGGRAPH 2025 unterstreichen die wachsende Konvergenz von künstlicher Intelligenz und Computergrafik, wobei sich Nvidia an die Spitze dieser Transformation stellt. Indem Nvidia KI-Agenten ein intelligenteres Denken ermöglicht und robuste Tools für das Training physischer KI bereitstellt, legt es den Grundstein für eine Zukunft, in der intelligente Maschinen unsere komplexe physische Welt nahtlos verstehen und darin agieren können.