Auf seiner GTC 2025-Veranstaltung hat NVIDIA ein Portfolio von Technologien vorgestellt, die die Entwicklung humanoider Roboter beschleunigen sollen. Zu diesen Innovationen gehört Isaac GR00T N1, das erste Open-Source- und anpassbare Grundmodell, das darauf abzielt, Roboter mit allgemeinen Denkfähigkeiten und vielseitigen Fähigkeiten auszustatten, um ihre Anpassung an verschiedene Aufgaben in unterschiedlichen Umgebungen zu erleichtern.
Eine neue Generation humanoider Roboter
GR00T N1 markiert einen bedeutenden Fortschritt in der allgemeinen Robotik, indem es Entwicklern ermöglicht, Humanoiden fortgeschrittene Denkfähigkeiten zu verleihen. Dieses Modell basiert auf einer kognitiven Architektur, die vom menschlichen Denken inspiriert ist und zwei Systeme kombiniert:
  • Vision-Language-Modell: Dieses methodische Denksystem basiert auf NVIDIA-Eagle mit SmolLM-1.7B. Es interpretiert die Umgebung durch Anweisungen von Vision und Sprache, was es den Robotern ermöglicht, über ihre Umgebung und Anweisungen zu denken und die richtigen Aktionen zu planen;
  • Diffusionstransformator: Dieses Aktionsmodell erzeugt kontinuierliche Aktionen, um die Bewegungen des Roboters zu steuern und den vom methodischen Denksystem entwickelten Aktionsplan in präzise und kontinuierliche Bewegungen des Roboters zu übersetzen.
GR00T N1 wurde auf einem großen Datensatz trainiert, der menschliche Demonstrationen und synthetische Daten umfasst, die von der NVIDIA Omniverse-Plattform generiert wurden. Dieser Ansatz ermöglicht es ihm, präzise Aufgaben wie Greifen, Objektmanipulation sowie mehrstufige Aktionssequenzen flüssig und präzise auszuführen.
NVIDIA hat mit führenden Unternehmen wie Agility Robotics, Boston Dynamics, Mentoree Robotics, NEURA Robotics und 1X Technologies zusammengearbeitet, die frühzeitig Zugang zu GR00T N1 erhielten. Während der Eröffnungskeynote demonstrierten Jensen Huang, CEO von NVIDIA, und Bernt Børnich, CEO von 1X Technologies, die Fähigkeiten des Modells mit dem Roboter NEO Gamma, der autonom Haushaltsaufgaben erledigte.
Ein verbessertes Simulations- und Lernökosystem
Parallel dazu hat NVIDIA mehrere ergänzende Technologien angekündigt:
  • Isaac GR00T Blueprint: Ein Rahmenwerk zur Generierung synthetischer Bewegungsdaten für das Training humanoider Roboter;
  • Newton: Eine Open-Source-Physik-Engine, die in Zusammenarbeit mit Google DeepMind und Disney Research entwickelt wurde und 2025 verfügbar sein wird. Auf NVIDIA Warp aufgebaut, ist Newton darauf ausgelegt, das Lernen von Robotern zu optimieren und sich mit Frameworks wie MuJoCo zu integrieren;
  • MuJoCo-Warp: Das Ergebnis einer Zusammenarbeit zwischen Google DeepMind und NVIDIA, dieses Projekt zielt darauf ab, robotische Simulationen mehr als 70-fach zu beschleunigen.
Diese Fortschritte stärken das Potenzial humanoider Roboter, insbesondere in industriellen und Unterhaltungsanwendungen. Disney Research plant, Newton zu nutzen, um ausdrucksstärkere Robotercharaktere zu entwickeln, ähnlich wie die von Star Wars inspirierten BDX-Droiden.
Jensen Huang erklärte:
"Das Zeitalter der allgemeinen Robotik ist angebrochen. Mit NVIDIA Isaac GR00T N1 und den neuen Frameworks zur Datengenerierung und zum robotischen Lernen werden Robotikentwickler weltweit die nächste Grenze des KI-Zeitalters eröffnen."
Die Trainingsdaten von GR00T N1 und die Szenarien zur Bewertung von Aufgaben stehen zum Download auf Hugging Face und GitHub zur Verfügung. Das NVIDIA Isaac GR00T-Modell zur Generierung synthetischer Bewegungsmanipulationen ist auch als interaktive Demo auf build.nvidia.com oder zum Download auf GitHub verfügbar.

Cet article publirédactionnel est publié dans le cadre d'une collaboration commerciale

Besser verstehen

Wodurch unterscheidet sich das Modell Isaac GR00T N1 im Hinblick auf die kognitive Architektur von anderen Robotermodellen?

Isaac GR00T N1 verwendet eine vom menschlichen Funktionieren inspirierte kognitive Architektur, die ein Vision-Language-Modell und einen Diffusionstransformator kombiniert, um Aktionen zu planen und zu generieren, sodass es Umgebungen menschlicher interpretieren und agieren kann.

Welche regulatorischen Herausforderungen stehen fortschrittlichen Robotertechnologien wie denen von NVIDIA gegenüber?

Fortschrittliche Robotertechnologien, wie die von NVIDIA entwickelten, müssen sich in einem komplexen regulatorischen Umfeld bewegen, in dem Sicherheit, Datenschutz und rechtliche Haftung große Anliegen sind. Regulierungsrahmen müssen sich entwickeln, um diese Innovationen sicher und ethisch zu integrieren.