zuruck zur Themenseite

Artikel und Hintergründe zum Thema

Interview mit Akhil Docca, Nvidia Omniverse

Andrea Gillhuber,

Wie KI die nächste Generation von Robotern antreibt

Im Interview erklärt Akhil Docca von Nvidia, wie die ‚Drei-Computer-Lösung‘ des Unternehmens funktioniert: Durch Training, Simulation und Betrieb sollen autonome Maschinen schon bald Teil unseres Alltags werden.

© Nvidia

Wie unterstützt Nvidias ‚Drei-Computer-Lösung‘ die Entwicklung und den Einsatz autonomer Roboter?

Akhil Docca: Nvidia versteht sich seit jeher als Plattformunternehmen. Wenn man unserem CEO Jensen Huang zuhört, wird schnell klar: Unser Ziel ist es, eine Plattform für beschleunigtes Computing zu bauen – und zwar als vollständigen Stack. Das bedeutet, dass wir die Hardware, unsere GPUs, mit Software, APIs und Frameworks verbinden, damit Entwickler diese Rechenleistung optimal nutzen können.

Als Technologieplattform wollen wir mit dem gesamten Ökosystem zusammenarbeiten. KI ist dabei natürlich ein wichtiger Bestandteil – und inzwischen spielt Robotik eine immer größere Rolle. Es gibt enormes Potenzial, auch die Robotik so zu beschleunigen, wie wir es bereits bei Deep Learning, KI-Training und Inferenz geschafft haben. Der nächste Schritt ist naheliegend: Wenn KI in der digitalen Welt funktioniert, wollen wir sie in die physische Welt bringen. Wir nennen das ‚Physical AI‘.

Nehmen wir ein Beispiel: Wenn man ChatGPT fragt, bleibt alles digital. Es gibt keine physische Komponente. Sobald KI aber ein physisches System steuert – sei es ein Roboter, ein Gebäude oder ein autonomes Fahrzeug – verändert sich die Herausforderung. Für uns ist ein ‚Roboter‘ alles: vom einfachen Industrieroboterarm bis hin zu autonomen Systemen, die draußen unterwegs sind.

Anzeige

Hier kommt unsere ‚Drei-Computer-Architektur‘ ins Spiel: Zuerst muss man das Gehirn des Roboters trainieren. Genauso wie Menschen Kognition brauchen, um Aufgaben zu lösen, gilt das auch für Roboter. Das ist der erste Computer.

Der zweite Computer ist die Simulation. Menschen simulieren ständig: Wann fahre ich los? Wie ist der Verkehr? Roboter müssen ebenfalls in der Lage sein, zu simulieren, um vorherzusagen, wie sie sich verhalten sollen. In der Simulation lernen Roboter also, Roboter zu sein.

Wenn die Simulation zeigt, dass der Roboter bereit ist, kommt der dritte Computer ins Spiel: der eigentliche Betrieb. Dabei wird die trainierte Intelligenz auf das physische System übertragen, das dann seine Aufgabe in der realen Welt ausführt. Zusammen bilden Training, Simulation und Betrieb die Grundlage moderner Robotik.

Nvidia baut keine Roboter, sondern stellt die Plattform bereit. Unternehmen wie Wandelbots oder Intrinsic nutzen unsere GPUs, Simulationsumgebungen oder Foundation-Modelle, um ihre eigenen Lösungen schneller zu entwickeln und mehr Produktivität zu schaffen. Unser Ziel ist es, den gesamten Stack bereitzustellen: vom Robotergehirn bis hin zur Laufzeit-Infrastruktur – alles, was man für ‚Physical AI‘ braucht.

Also eine durchgängige Plattform für Programmierung und Steuerung?

Ganz genau. Auf der GTC in San Jose haben wir zum Beispiel ‚GR00T N1‘ vorgestellt, unser Foundation-Modell für Roboter. Die Idee: Ein Modell, das eine Vielzahl an Aufgaben bewältigen kann. Früher brauchte man mehrere spezialisierte Modelle: für Wahrnehmung, Segmentierung oder Steuerung. Jetzt kann ein großes Modell all diese Funktionen abdecken, ein echtes ‚Robotergehirn‘.

GR00T N1 ist frei verfügbar, jeder Entwickler kann es herunterladen und für seine Anwendung nutzen. Das ist der erste Teil. Der zweite Teil ist ‚Nvidia Omniverse‘, unsere Simulationsplattform. Simulation ist entscheidend: Will man einem Roboter beibringen, eine Flasche aufzuheben und woanders abzulegen, muss man testen können, ob er das optimal macht. Omniverse bietet eine physikalisch genaue, fotorealistische Umgebung, um Szenarien sicher zu erproben, Steuerungen zu optimieren und reale Bedingungen zu simulieren.

Wenn das funktioniert, kommt der dritte Schritt: Das Modell läuft dann auf der realen Hardware, in der Regel auf unserer Jetson-Plattform am Edge. Der Workflow lautet also: Trainieren, simulieren, ausrollen. Manche Entwickler brauchen nur einen Teil davon, zum Beispiel nur Omniverse, aber für Robotik braucht man oft alle drei Komponenten.

Gibt es einen Unterschied zwischen dem Ansatz in den USA und Europa?

Die Kernfrage ist überall dieselbe: Wie bringt man KI in reale Systeme? Zunächst geht es immer um Wahrnehmung – der Roboter muss sehen und verstehen können. Aber Roboter müssen auch in unstrukturierten Umgebungen funktionieren. Klassische Roboter arbeiten perfekt in fest definierten, wiederholbaren Umgebungen. Doch sobald Flexibilität gefragt ist, braucht man KI: Sehen, Denken, Bewegen.

Wir sehen in Europa und den USA die gleichen Anforderungen: Hersteller wollen Robotern Sehen und Intelligenz verleihen, damit sie komplexere Aufgaben übernehmen können. Das ist nur mit KI möglich.

Wie sieht es mit humanoiden Robotern aus?

Humanoide stehen aktuell stark im Fokus. Einer unserer Partner, Neura Robotics, hat auf der Automatica einen humanoiden Roboter vorgestellt. Jensen sagt oft: ‚Die Welt ist für Menschen gemacht – Türrahmen, Arbeitsplätze, Werkzeuge. Deshalb ist die humanoide Form so spannend.‘

Ein Roboterarm oder ein mobiler Roboter ist für bestimmte Aufgaben ideal. Aber bei gefährlichen, körperlich anstrengenden oder monotone Tätigkeiten können Humanoide helfen. Mit ‚Isaac GR00T‘ stellen wir einen offenen Entwicklungs-Stack bereit: Foundation-Modelle, Data Pipelines, Simulations-Frameworks, alles, was Unternehmen wie Neura brauchen, um die nächste Generation universeller Roboter zu entwickeln.

Humanoide sind mobil, sprich: nicht an der Energieversorgung angeschlossen, benötigen bei einer hohen Rechenleistung entsprechend viel Energie. Wie kann man das bewältigen?

Energieeffizienz ist ein zentrales Thema, besonders bei humanoiden Robotern. Bewegung, Antrieb, Motoren, das alles braucht viel Energie. Gleichzeitig müssen die Modelle möglichst effizient laufen.

Unsere Jetson-Plattform ist dafür gemacht: leistungsstarke Edge-KI bei niedrigem Energiebedarf. Sie ist skalierbar, man kann je nach Bedarf ein Jetson-Modul oder mehrere kombinieren.

Dazu kommen Software-Werkzeuge, um Modelle zu optimieren. ‚TensorRT‘ ist eine Bibliothek, um KI-Modelle zu komprimieren. Ein trainiertes Modell ist oft sehr groß und rechenintensiv. TensorRT vereinfacht es so, dass es effizienter läuft, ohne an Präzision zu verlieren. Ursprünglich war das für Computer Vision gedacht, heute setzen wir es auch für große Robotik-Modelle ein, damit sie in Echtzeit auf Edge-Geräten laufen.

Welche Trends werden KI und Robotik in den nächsten fünf Jahren prägen?

Ein klarer Trend sind Foundation-Modelle für Robotik. Der Flaschenhals dabei: die Daten. Anders als bei Sprachmodellen gibt es keine riesigen, frei verfügbaren Datenmengen für Roboterbewegungen. Roboter benötigen qualitativ hochwertige Trajektorien für spezifische Aufgaben – deren Erfassung ist teuer.

Deshalb entwickeln wir Tools wie den ‚GR00T-Mimic-Blueprint‘. Damit können Experten mit XR-Headsets (Extended Reality) Bewegungen aufnehmen. Diese realen Daten werden dann in der Simulation erweitert und mit Omniverse verfeinert. Außerdem nutzen wir ‚Cosmos World Foundation Models‘, die fotorealistische synthetische Daten als Ergänzung zu realen Daten erzeugen. Synthetische Daten sind entscheidend, um neue Anwendungsfälle zu trainieren.

Drei Trends sehe ich also klar: Erstens – Foundation-Modelle für universelle Roboter. Zweitens – die Kombination aus synthetischen und realen Daten. Drittens – physikalisch exakte Simulationen mit Reinforcement Learning, damit Roboter virtuell scheitern und lernen, bevor sie in der realen Welt eingesetzt werden.

Wie realistisch ist die Simulation im Vergleich zur echten Welt?

Mit Omniverse wollen wir eine physikalisch exakte Simulation schaffen. Es ist keine Game Engine, sondern wurde speziell entwickelt, um reale Physik abzubilden: Kräfte, Materialeigenschaften, Verformungen. Wenn ein Greifer zu stark zugreift, darf der Gegenstand nicht einfach durch die Finger rutschen, er muss zerbrechen, wenn er zerbrechlich ist.So entsteht ein ‚Digitaler Zwilling‘. Ein guter digitaler Zwilling ist unverzichtbar, um verlässliche Simulationsergebnisse zu erhalten. Mit einem digitalen Zwilling kann man Produktionslinien optimieren und Roboter virtuell testen. Reinforcement Learning ermöglicht es, dass Roboter ausprobieren, scheitern und besser werden, bevor sie reale Aufgaben übernehmen.

Wie skaliert man das auf ganze Roboterflotten?

Wir bewegen uns von einzelnen Robotern hin zu koordinierten Flotten – das nennen wir ‚Mega Blueprint‘. Man kann sich das vorstellen wie eine Fabrik: ein mobiler Roboter für den Transport, ein kollaborativer Arm für die Linie, ein humanoider Roboter für allgemeine Aufgaben. Jeder hat sein eigenes ‚Gehirn‘, aber sie müssen zusammenarbeiten.

Mit Simulation kann man diese Zusammenarbeit im großen Maßstab testen – physikalisch korrekt, mit realistischen Einschränkungen. Unternehmen wie Schaeffler oder Idealworks nutzen Mega Blueprint, um komplette Flotten zu simulieren und zu optimieren, bevor sie in den Einsatz gehen.

Unsere Vision ist es, die nahtlose Orchestrierung verschiedenster Roboter zu ermöglichen – sicher, effizient und intelligent.

  • Xing Icon
  • LinkedIn Icon
Anzeige
zurück zur Themenseite
Anzeige

Das könnte Sie auch interessieren

Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige

VDI

Fachkonferenz „Machine Vision“ in Baden-Baden

Die VDI-Fachkonferenz „Machine Vision – Von der Inspektion zur smarten Revolution“ am 17./18. Juni 2026 in Baden-Baden vermittelt einen umfassenden praxisbezogenen Einblick in aktuelle Anwendungen des maschinellen Sehens. Einen Schwerpunkt bildet...

mehr...
Jetzt Newsletter abonnieren