Hélice da figura: ai que traz robôs humanos para sua casa


A Figura AI acaba de lançar a documentação e as demos para seu mais recente robô humanóide, Helix. A Helix é construída sobre uma estrutura de ação em linguagem de visão (VLA), projetada para permitir que os robôs humanóides raciocinam e operem com capacidades semelhantes a seres humanos. Essa abordagem visa enfrentar o desafio de dimensionar a robótica de ambientes industriais controlados para as configurações imprevisíveis e variadas das casas. Abaixo está um detalhamento abrangente de tudo o que se sabe sobre a helix com base nas informações disponíveis.

O que é helix?

A Helix é apontada como o primeiro modelo VLA a fornecer controle contínuo de alta taxa e contínuo sobre uma parte superior do corpo humanóide inteiro, incluindo o tronco, cabeça, pulsos e dedos individuais. Esse nível de controle – abrangendo 35 graus de liberdade (DOF) – é um salto adiante na destreza robótica e autonomia. Diferentemente dos sistemas robóticos tradicionais que requerem programação handbook extensa ou milhares de demonstrações específicas de tarefas, a Helix permite que os robôs executem tarefas complexas e de longo horizonte em tempo actual usando os avisos de linguagem pure. Essa capacidade é um passo crítico para tornar os robôs práticos para o uso doméstico, onde devem lidar com objetos diversos e novos e se adaptar a situações dinâmicas.

Arquitetura: Sistema 1 e Sistema 2

A Helix emprega uma arquitetura de sistema duplo inspirado em modelos cognitivos humanos, especificamente a estrutura “pensante, rápida e lenta” de Daniel Kahneman:

Sistema 2

Este é o componente “Huge Mind”, um modelo de linguagem de visão de 7 bilhões de parâmetros (VLM) pré-criada em dados em escala na Web. Ele lida com raciocínio de alto nível, entendimento da linguagem e interpretação visible. O sistema 2 permite que o robô processe comandos abstratos (por exemplo, “Pegue o merchandise do deserto”) e os traduz em etapas acionáveis, identificando objetos e contextos relevantes.

Sistema 1

Esta é uma política visuomotora de 80 milhões de parâmetros otimizada para controle rápido e de baixo nível. Ele executa ações físicas precisas, como agarrar ou manipular objetos, com base nas diretivas do sistema 2. Seu tamanho menor garante tempos rápidos de resposta adequados para operações robóticas em tempo actual.

Ambos os sistemas são executados em GPUs incorporadas a bordo com baixo consumo de energia, tornando a hélice comercialmente viável para implantação sem dependência de recursos externos de computação. Esse processamento a bordo é um recurso essencial, garantindo que o robô possa operar independentemente em ambientes do mundo actual.

Leia também: Os 6 principais robôs humanóides em 2025

O que torna a hélice da figura especial?

Helix aborda um desafio elementary na robótica: a incapacidade dos sistemas atuais de escalar para ambientes não estruturados, como casas. A robótica tradicional depende de configurações controladas com tarefas predefinidas, mas as casas apresentam uma variedade caótica de objetos e cenários. A capacidade da Helix de raciocinar e se adaptar sem extensa intervenção humana a posiciona como uma “mudança de etapa” nas capacidades, como afirma a figura. Esse avanço aproxima os robôs humanóides da implantação prática em famílias, potencialmente transformando a vida cotidiana, automatizando tarefas como limpeza, organização e assistência nas tarefas.

Realizações técnicas

  • Rede neural única: Diferentemente das abordagens anteriores que requerem modelos separados para tarefas diferentes, o Helix usa um conjunto unificado de pesos da rede neural para lidar com todos os comportamentos-escolhando, colocando, operação de gavetas, tarefas de refrigeração e interações multi-robôs-sem ajuste fino específico da tarefa.
  • Geração de comportamento na fly-fly: Helix gera comportamentos inteligentes e novos para objetos que nunca viu, reduzindo a necessidade de esforço humano na coleta de programação ou demonstração.
  • Prontidão comercial: Em execução inteiramente nas GPUs incorporadas, a Helix foi projetada para aplicativo imediato do mundo actual, evitando os problemas de latência e dependência dos sistemas baseados em nuvem.

Demonstrações

A Figura divulgou vários vídeos que mostram a hélice em ação:

  1. Armazenamento colaborativo de supermercado: Dois robôs, alimentados por uma única instância da hélice, trabalham juntos para armazenar mantimentos que nunca encontraram, demonstrando coordenação e adaptabilidade.
  2. Manipulação de objetos: Os robôs escolhem e colocam diversos itens domésticos em recipientes, operam gavetas e interagem com geladeiras, tudo com base em instruções de linguagem pure.
  3. Raciocínio conceitual: Em um exemplo, a Helix interpreta “Pegue o merchandise do deserto” e seleciona um cacto de brinquedo, destacando sua capacidade de conectar linguagem abstrata às ações físicas.

Armazenamento colaborativo de supermercado

Este vídeo apresenta dois robôs de figura, ambos controlados por uma única rede neural da hélice, trabalhando juntos para armazenar mantimentos. Os itens são novos – significando que os robôs nunca os encontraram antes – e incluem objetos com diversas formas, tamanhos e materiais (por exemplo, sacos de biscoitos, latas ou produtos).

Os robôs demonstram coordenação, como entregar itens um para o outro e colocá -los em gavetas ou contêineres, tudo com base em avisos de linguagem pure como “Entregue o saco de biscoitos ao robô à sua direita” ou “Coloque -o na gaveta aberta.”Isso mostra a capacidade da Helix de gerenciar a colaboração de vários robôs e a generalização zero-tiro (executando tarefas sem treinamento prévio em objetos específicos).

Coordenação completa do corpo superior

Este vídeo enfatiza o controle da Helix sobre um espaço de ação de 35 graus de liberdade (DOF) a 200Hz. O robô manipula os itens domésticos enquanto coordenam toda a parte superior do corpo – Totorso, cabeça, pulsos e dedos individuais. Por exemplo, ele rastreia suas mãos com a cabeça para o alinhamento visible e ajusta seu tronco para o alcance best, mantendo os movimentos precisos dos dedos para entender os objetos com segurança. Isso demonstra a destreza e a estabilidade em tempo actual do modelo, superando desafios históricos, como loops de suggestions que desestabilizam sistemas de alto escalão.

Agarrar idioma para ação

Helix lida com comandos de alto nível. Isso os transforma em ações precisas. Solicitado com ‘pegue o merchandise do deserto’, ele age. O robô vê um cacto de brinquedo. Ele o escolhe de vários objetos. Escolhe a mão direita. Então ele agarra com segurança. Isso mostra a habilidade de Helix. Ele vincula um amplo entendimento da linguagem ao controle motor. Raciaboa sobre idéias abstratas e age sem demos anteriores.

Conclusão

Helix é a IA interna da figura. É um modelo inovador de ação em linguagem de visão. Dá a robôs humanóides raciocínio e destreza semelhantes a humanos. Sua arquitetura de sistema duplo ajuda isso. O mesmo acontece com seu manuseio de objetos generalizados e processamento a bordo. Isso o torna um avanço importante da robótica. É especialmente adequado para casas. Helix permite que os robôs entendam a linguagem pure. Eles podem raciocinar através de tarefas. Eles podem manipular quase qualquer merchandise doméstico sem treinamento prévio. A promessa de ‘mudança de etapa’ da Figura da Figura na robótica.

Mantenha -se atualizado com os últimos acontecimentos do mundo da IA ​​com Analytics Vidhya Information!

Olá, sou Nitika, criador de conteúdo e profissional de conteúdo experiente em tecnologia. Criatividade e aprender coisas novas são naturalmente para mim. Tenho experiência na criação de estratégias de conteúdo orientadas por resultados. Sou bem versado em gerenciamento de search engine optimization, operações de palavras -chave, redação de conteúdo da Net, comunicação, estratégia de conteúdo, edição e redação.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *