Durante seu evento GTC 2025, a NVIDIA revelou um portfólio de tecnologias destinadas a acelerar o desenvolvimento de robôs humanoides. Entre essas inovações está o Isaac GR00T N1, o primeiro modelo de fundação open source e personalizável, que visa dotar os robôs com capacidades de raciocínio generalizado e habilidades versáteis, facilitando sua adaptação a diversas tarefas em ambientes variados.
Uma nova geração de robôs humanoides
O GR00T N1 marca um avanço significativo na robótica generalista ao permitir que os desenvolvedores dotem os humanoides com capacidades de raciocínio avançadas. Este modelo baseia-se em uma arquitetura cognitiva inspirada no funcionamento humano, combinando dois sistemas:
  • Modelo Visão-Linguagem: Este sistema de pensamento metódico é baseado no NVIDIA-Eagle com SmolLM-1.7B. Ele interpreta o ambiente por meio de instruções de visão e linguagem, permitindo aos robôs raciocinarem sobre seu ambiente e instruções, e planejarem as ações adequadas;
  • Transformador de difusão: Este modelo de ação gera ações contínuas para controlar os movimentos do robô, traduzindo o plano de ação elaborado pelo sistema de pensamento metódico em movimentos precisos e contínuos do robô.
O GR00T N1 foi treinado em um vasto conjunto de dados, incluindo demonstrações humanas e dados sintéticos gerados pela plataforma NVIDIA Omniverse. Essa abordagem permite que ele execute tarefas precisas como apreensão, manipulação de objetos e também sequências de ações multi-etapas, com fluidez e precisão.
A NVIDIA colaborou com empresas líderes como Agility Robotics, Boston Dynamics, Mentoree Robotics, NEURA Robotics e 1X Technologies, que tiveram acesso antecipado ao GR00T N1. Durante a palestra de abertura, Jensen Huang, CEO da NVIDIA, e Bernt Børnich, CEO da 1X Technologies, demonstraram as capacidades do modelo com o robô NEO Gamma, que efetuou de forma autônoma tarefas de organização doméstica.
Um ecossistema de simulação e aprendizado aprimorado
Paralelamente, a NVIDIA anunciou várias tecnologias complementares:
  • Isaac GR00T Blueprint: Uma estrutura para gerar dados sintéticos de movimento para o treinamento de robôs humanoides;
  • Newton: Um motor físico open source desenvolvido em colaboração com Google DeepMind e Disney Research, que estará disponível em 2025. Construído sobre o NVIDIA Warp, Newton é projetado para otimizar o aprendizado dos robôs e se integrará com frameworks como MuJoCo;
  • MuJoCo-Warp: Resultado de uma colaboração entre Google DeepMind e NVIDIA, este projeto visa acelerar as simulações robóticas em mais de 70 vezes.
Esses avanços reforçam o potencial dos robôs humanoides, especialmente em aplicações industriais e de entretenimento. A Disney Research planeja usar o Newton para desenvolver personagens robóticos mais expressivos, como os dróides BDX inspirados em Star Wars.
Jensen Huang afirmou:
"A era da robótica generalista chegou. Com o NVIDIA Isaac GR00T N1 e os novos frameworks de geração de dados e aprendizado robótico, os desenvolvedores de robótica em todo o mundo abrirão a próxima fronteira na era da IA."
Os dados de treinamento do GR00T N1 e os cenários de avaliação de tarefas estão disponíveis para download em Hugging Face e GitHub. O modelo NVIDIA Isaac GR00T para geração de movimento de manipulação sintética também está disponível como uma demonstração interativa em build.nvidia.com ou para download em GitHub.

Cet article publirédactionnel est publié dans le cadre d'une collaboration commerciale

Para entender melhor

Como o modelo Isaac GR00T N1 se diferencia de outros modelos robóticos em termos de arquitetura cognitiva?

Isaac GR00T N1 utiliza uma arquitetura cognitiva inspirada no funcionamento humano, combinando um modelo Visão-Linguagem e um Transformador de difusão para planejar e gerar ações, permitindo interpretar e agir em vários ambientes de forma mais humana.

Quais são os desafios regulatórios enfrentados pelas tecnologias robóticas avançadas como as da NVIDIA?

As tecnologias robóticas avançadas, como aquelas desenvolvidas pela NVIDIA, devem navegar em um cenário regulatório complexo onde segurança, privacidade e responsabilidade legal são preocupações importantes. Os marcos regulatórios precisam evoluir para integrar essas inovações de forma segura e ética.