Nvidia anunciou um conjunto de tecnologias de IA projetadas para acelerar o desenvolvimento de robôs humanóides. O portfólio inclui Isaac Gr00T N1, aclamado como o primeiro modelo de fundação aberto e totalmente personalizável do mundo para o raciocínio e habilidades humanóides de uso geral.
Juntamente com esse modelo principal, a NVIDIA também está introduzindo estruturas de simulação e plantas, como o plano NVIDIA Isaac GR00T para gerar dados sintéticos. Além disso, a empresa revelou Newton, um mecanismo de física de código aberto atualmente em desenvolvimento em colaboração com o Google DeepMind e a Disney Analysis, projetada especificamente para a criação de robôs.
O modelo GR00T N1 já está disponível e representa o primeiro em uma família planejada de modelos totalmente personalizáveis que a NVIDIA pretende pré-treinar e liberar para desenvolvedores de robótica em todo o mundo. Essa iniciativa visa acelerar drasticamente a transformação de indústrias que atualmente lidam com a escassez international de mão -de -obra, estimada em mais de 50 milhões de pessoas em todo o mundo.
“A period da robótica generalista está aqui”, declarou Jensen Huang, fundador e CEO da Nvidia. “Com a Nvidia Isaac GR00T N1 e as novas estruturas de geração de dados e aprendizado de robôs, os desenvolvedores de robótica em todos os lugares abrirão a próxima fronteira na period da IA”.
Nvidia gr00t n1: ai para o desenvolvimento de robôs humanóides
O modelo GR00T N1 Basis possui uma arquitetura sofisticada de sistema duplo, inspirando-se nos princípios da cognição humana. O primeiro componente, apelidado de “System 1”, é um modelo de ação de pensamento rápido, espelhando reflexos ou intuição humana. Complementando isso é o “Sistema 2”, um modelo de pensamento mais lento, projetado para tomada de decisão deliberada e metódica.
Alimentado por um modelo de linguagem de visão, o sistema 2 analisa seus arredores e as instruções que foram dadas para formular planos de ação. O sistema 1 traduz esses planos em movimentos precisos e contínuos do robô. Criticamente, o sistema 1 é treinado nos dados de demonstração humana e em uma grande quantidade de dados sintéticos gerados pela NVIDIA Omniverse plataforma.
As capacidades do GR00T N1 permitem generalizar facilmente tarefas comuns, como agarrar e manipular objetos com um ou ambos os braços e transferir itens entre os braços. Também pode executar tarefas complexas e de várias etapas que exigem contexto a longo prazo e uma combinação de habilidades gerais. Essas habilidades têm aplicativos em potencial em vários setores, incluindo manuseio de materiais, embalagens e inspeção de qualidade.
Desenvolvedores e pesquisadores têm a flexibilidade de treinar ainda mais o GR00T N1 usando seus próprios dados do mundo actual ou sintéticos, adaptando-os aos seus requisitos específicos de robô humanóide ou tarefas.
Durante seu discurso principal na recente conferência do GTC, Huang mostrou um robô humanóide da 1x tarefas de arrumação doméstica de execução autonomamente. Essa demonstração utilizou uma política pós-treinada construída sobre o modelo GR00T N1, destacando a eficácia da colaboração de treinamento de IA entre 1x e Nvidia.
“O futuro dos humanóides é sobre adaptabilidade e aprendizado”, afirmou Bernt Børnich, CEO da 1x tecnologias. “Enquanto desenvolvemos nossos próprios modelos, o GR00T N1 da NVIDIA oferece um impulso significativo ao raciocínio e às habilidades do robô.
“Com dados mínimos pós-treinamento, implantamos totalmente o Neo Gamma-avançando nossa missão de criar robôs que não são apenas ferramentas, mas companheiros capazes de ajudar os seres humanos de maneiras significativas e incomensuráveis”.
Outros desenvolvedores de robôs humanóides que obtiveram acesso antecipado ao GR00T N1 incluem robótica de agilidade, Boston Dynamics, Mentee Robotics e Neura Robotics.
NVIDIA, Google Deepmind e Disney Analysis colaboram no Newton Physics Engine
Em um impulso adicional ao ecossistema de robótica, a Nvidia anunciou um esforço colaborativo com o Google DeepMind e a Disney Analysis para desenvolver Newton, um mecanismo de física de código aberto projetado para permitir que os robôs aprendam a lidar com tarefas complexas com maior precisão.
Construído sobre a estrutura da NVIDIA Warp, Newton será otimizado para o aprendizado de robôs e será compatível com estruturas de simulação populares, como o Mujoco e o NVIDIA Isaac Lab do Google DeepMind. Além disso, as empresas colaboradoras pretendem integrar o mecanismo de física proprietária da Disney ao Newton.
O Google DeepMind e a NVIDIA também estão trabalhando juntos para desenvolver o Mujoco-Warp, uma tecnologia que deve acelerar as cargas de trabalho de aprendizado de máquina de robótica em mais de 70 vezes. Este avanço será disponibilizado aos desenvolvedores através do Google DeepMind’s Mjx Biblioteca de código aberto, bem como através de Newton.
A Disney Analysis estará entre os primeiros a aproveitar Newton para promover sua plataforma de personagens robóticos, que alimenta robôs de entretenimento da próxima geração. Os exemplos incluem os expressivos dróides BDX inspirados em Guerra nas Estrelas que se juntaram a Huang no palco durante sua palestra do GTC.
“Os dróides do BDX são apenas o começo. Estamos comprometidos em dar vida a mais personagens de maneiras que o mundo não viu antes, e essa colaboração com a Disney Analysis, Nvidia, e o Google Deepmind é uma parte essencial dessa visão”, disse Kyle Laughlin, SVP da Walt Disney Imagineering Analysis & Improvement.
“Essa colaboração nos permitirá criar uma nova geração de personagens robóticos mais expressivos e envolventes do que nunca – e nos conectaram com nossos convidados de maneiras que apenas a Disney pode”.
Além disso, a NVIDIA e a Disney Analysis – em conjunto com a Intrinsic – anunciaram uma colaboração adicional focada na construção OpenUSD Pipelines e estabelecimento de melhores práticas para os fluxos de trabalho de dados de robótica.
Nvidia aborda a falta de dados para o treinamento de robôs humanóides
A disponibilidade de conjuntos de dados grandes, diversos e de alta qualidade é essential para o desenvolvimento eficaz do robô, mas capturar esses dados pode ser caro. Para robôs humanóides, a quantidade de dados de demonstração humana no mundo actual é inerentemente limitada.
Para enfrentar esse desafio, a Nvidia revelou o plano Isaac GR00T para geração de movimento de manipulação sintética. Construído sobre os modelos Omniverse e NVIDIA Cosmos Switch World Basis, esse plano permite que os desenvolvedores gerem quantidades exponencialmente grandes de dados de movimento sintético para tarefas de manipulação, a partir de um pequeno número de demonstrações humanas.
Utilizando os componentes iniciais disponíveis para o plano, a NVIDIA gerou com sucesso 780.000 trajetórias sintéticas – equivalente a 6.500 horas ou nove meses contínuos de dados de demonstração humana – em apenas 11 horas. Posteriormente, ao combinar esses dados sintéticos com dados do mundo actual, a NVIDIA obteve uma melhoria de 40% no desempenho do GR00T N1 em comparação com o uso de apenas dados reais.
Para capacitar ainda mais a comunidade de desenvolvedores com valiosos recursos de treinamento, a NVIDIA está lançando o conjunto de dados GR00T N1 como parte de um conjunto de dados físico de IA físico mais amplo, também anunciado no GTC e agora acessível em Abraçando o rosto.
Então, quando está tudo isso disponível?
Os dados de treinamento de NVIDIA GR00T N1 e cenários de avaliação de tarefas para robôs humanóides estão disponíveis para obtain imediato de Hugging Face and Github. O plano NVIDIA Isaac Gr00T para geração de movimento de manipulação sintética também está agora disponível como uma demonstração interativa no Construct.nvidia.com ou para obtain do GitHub.
O supercomputador de IA pessoal da NVIDIA DGX Spark, também anunciado hoje no GTC, oferece aos desenvolvedores um sistema pronto para uso para expandir os recursos do GR00T N1 para novos robôs, tarefas e ambientes sem exigir uma extensa programação personalizada.
Prevê -se que o mecanismo de física de Newton esteja disponível ainda este ano.
Veja também: Gemini Robotics: Google DeepMind pretende robôs úteis de IA


Deseja aprender mais sobre IA e Massive Information dos líderes do setor? Confira Ai & Massive Information Expo Ocorrendo em Amsterdã, Califórnia e Londres. O evento abrangente é co-localizado com outros eventos principais, incluindo Conferência de Automação InteligenteAssim, BlockxAssim, Semana de Transformação Digitale Cyber Safety & Cloud Expo.
Discover outros próximos eventos de tecnologia corporativa e webinars alimentados pela TechForge aqui.