Trabalhe com o Humanóide Atlas Robotic da Boston Dynamics mostra uma nova abordagem para aprender novas tarefas complexas usando um modelo de IA de assistir humano.
Programando uma máquina para a grande variedade de desafios em um ambiente humano, desde lidar com objetos delicados até a navegação de espaços desordenados, tem sido uma tarefa monumental. Agora, os grandes modelos de comportamento (LBMS) prometem ajudar os robôs a aprender tarefas mais rapidamente.
Atlas se torna um aprendiz de robô
Em uma demonstração por Boston Dynamics e Toyota Analysis Institute (TRI), um único modelo de IA orienta o robô do Atlas através de uma longa tarefa de “workshop de spot”. O robô coordena todo o seu corpo para pegar peças de um carrinho, dobrá -las e colocá -las em uma prateleira. Em seguida, puxa uma lixeira baixa para armazenar outros componentes antes de limpar os itens restantes em um caminhão grande.
Mas a verdadeira mágica acontece quando as coisas não vão planejar. As versões iniciais da IA não conseguiram lidar com surpresas. A solução não foi escrever um novo código complexo. Em vez disso, a equipe simplesmente tinha um operador humano demonstrar como se recuperar de erros, como uma parte caindo no chão ou uma tampa de lixeira fechando inesperadamente. Depois de recorrer a rede com esses novos exemplos, o robô aprendeu a ser reativo e resolver problemas por conta própria.
Essa habilidade vem do poder da política de estimar o que está acontecendo no mundo com base em seus sensores e reaja com base nas experiências que viu em seu treinamento. A programação de novos comportamentos não requer mais anos de engenharia especializada e cria uma oportunidade para ampliar rapidamente o que o robô do Atlas pode fazer.
O humano na máquina
Então, como você ensina um robô? O processo começa com um operador humano entrando em uma plataforma de realidade digital. Usando um fone de ouvido VR, o operador está totalmente imerso no espaço de trabalho do robô, vendo o que vê através de suas câmeras estéreo montadas na cabeça. Com os rastreadores nas mãos e nos pés, eles podem controlar o Atlas de maneira fluida e intuitiva, com seus movimentos mapeados diretamente para a máquina.
Este sistema de teleooperação é o que permite a coleta de dados de alta qualidade. Seja agachado baixo para pegar algo ou tomar medidas cuidadosas para se reposicionar, as ações do robô são guiadas por um humano, gerando os dados brutos necessários para o aprendizado.
Esses dados alimentam o robô do Atlas “Mind”: uma arquitetura de transformador de difusão de 450 milhões de parâmetros. O modelo absorve tudo o que o robô detecta-imagens, sua própria posição corporal (propriocepção) e um immediate de alto nível de linguagem, dizendo o que fazer-e, em troca, gera as ações necessárias para controlar o corpo inteiro de 50 graus da Atlas.
Tudo isso acontece em um loop iterativo contínuo: colete dados, treine o modelo e avalie o desempenho para decidir quais dados coletar a seguir.
Aprendendo tarefas complexas e imprevisíveis
Ao treinar políticas em uma enorme variedade de tarefas, os pesquisadores descobriram que o robô fica melhor na generalização e na recuperação de erros. O sistema pode aprender a realizar trabalhos que seriam excepcionalmente difíceis de codificar manualmente devido à sua natureza complexa e imprevisível.
Usando um único modelo de IA condicionado ao idioma, o Atlas aprendeu a amarrar uma corda, espalhar uma toalha de mesa e até manipular um pneu de carro de 22 lb.
A equipe descobriu que, para o LBMS, o processo é o mesmo se o robô está empilhando blocos rígidos ou dobrando uma camiseta: se um humano pode demonstrá-lo, um robô como o Atlas pode aprendê-lo. Como bônus, eles também descobriram que poderiam acelerar as ações do robô em tempo de execução, geralmente realizando tarefas 1,5 a 2 vezes mais rápido que a demonstração humana sem qualquer queda no desempenho.
As próximas etapas envolvem ampliar esse “volante de dados” para aumentar a diversidade e a dificuldade das tarefas, além de explorar novos algoritmos de AI e maneiras de incorporar outras fontes de dados. É um passo no longo caminho em direção a um futuro em que robôs humanóides como Atlas podem trabalhar conosco e para nós, no mundo actual.
(Crédito da imagem: Boston Dynamics)
Veja também: Dominic Maidment, Unilever: IoT dá a cadeias de suprimentos ‘um sexto sentido’


Quer aprender sobre a IoT dos líderes da indústria? Confira IoT Tech Expo Ocorrendo em Amsterdã, Califórnia e Londres. O evento abrangente é co-localizado com outros eventos principais, incluindo Cyber Safety & Cloud ExpoAssim, Ai & Large Knowledge ExpoAssim, Conferência de Automação InteligenteAssim, Expo de computação de bordae Semana de Transformação Digital.
Discover outros próximos eventos de tecnologia corporativa e webinars alimentados pela TechForge aqui.