Robotic Veja, Robotic Do: System aprende depois de assistir a Tos


Robotic Veja, Robotic Do: System aprende depois de assistir a TosKushal Kedia (à esquerda) e Prithwish Dan (à direita) são membros da equipe de desenvolvimento por trás da Rhyme, um sistema que permite que os robôs aprendam tarefas assistindo a um único vídeo de instruções.

Por Louis DiPietro

Os pesquisadores de Cornell desenvolveram uma nova estrutura robótica alimentada pela inteligência artificial-chamada rima (recuperação para imitação híbrida sob execução incompatível)-que permite que os robôs aprendam tarefas assistindo a um único vídeo de instruções. A rima pode acelerar o desenvolvimento e a implantação de sistemas robóticos, reduzindo significativamente o tempo, a energia e o dinheiro necessários para treiná-los, disseram os pesquisadores.

“Uma das coisas irritantes de trabalhar com robôs é coletar tantos dados sobre o robô fazendo tarefas diferentes”, disse Kushal Kedia, um estudante de doutorado no campo da ciência da computação e principal autor de um artigo correspondente sobre rima. “Não é assim que os seres humanos realizam tarefas. Nós consideramos outras pessoas como inspiração.”

Kedia apresentará o artigo, Imitação de um tiro sob execução incompatívelem maio do Instituto de Conferência Internacional de Engenheiros Elétricos e Eletrônicos sobre Robótica e Automação, em Atlanta.

Os assistentes de robôs domésticos ainda estão muito longe – é uma tarefa muito difícil treinar robôs para lidar com todos os cenários em potencial que eles poderiam encontrar no mundo actual. Para acelerar os robôs, pesquisadores como a Kedia os estão treinando com o que equivale a vídeos de instruções-demonstrações humanas de várias tarefas em um ambiente de laboratório. A esperança com essa abordagem, um ramo do aprendizado de máquina chamado “Aprendizagem de imitação” é que os robôs aprenderão uma sequência de tarefas mais rapidamente e poderão se adaptar aos ambientes do mundo actual.

“Nosso trabalho é como traduzir francês para inglês – estamos traduzindo qualquer tarefa de humano para robô”, disse o autor sênior Sanjiban Choudhury, professor assistente de ciência da computação no Cornell Ann S. Bowers School of Computing and Data Science.

Essa tarefa de tradução ainda enfrenta um desafio mais amplo, no entanto: os seres humanos se movem com muita fluidez para um robô rastrear e imitar, e o treinamento de robôs com vídeo requer gobos. Além disso, demonstrações em vídeo – de, digamos, pegar um guardanapo ou empilhar pratos de jantar – devem ser executados lenta e sem falhas, uma vez que qualquer incompatibilidade em ações entre o vídeo e o robô historicamente soletrava desgraça para o aprendizado de robôs, disseram os pesquisadores.

“Se um humano se transfer de uma maneira diferente de como um robô se transfer, o método imediatamente se desfaz”, disse Choudhury. “Nosso pensamento period: ‘Podemos encontrar uma maneira de lidar com essa incompatibilidade entre como os humanos e os robôs realizam tarefas?'”

A rima é a resposta da equipe – uma abordagem escalável que torna os robôs menos mecânicos e mais adaptáveis. Ele treina um sistema robótico para armazenar exemplos anteriores em seu banco de memória e conectar os pontos ao executar tarefas que visualizou apenas uma vez, desenhando vídeos que viu. Por exemplo, um robô equipado com rima mostrou um vídeo de um humano buscar uma caneca do balcão e colocá-lo em uma pia próxima penteará seu banco de vídeos e se inspirará em ações semelhantes-como agarrar um copo e diminuir um utensílio.

A Rhyme abre o caminho para os robôs aprenderem sequências de várias etapas, reduzindo significativamente a quantidade de dados de robôs necessários para o treinamento, disseram os pesquisadores. Eles afirmam que a rima requer apenas 30 minutos de dados de robôs; Em um ambiente de laboratório, os robôs treinados usando o sistema alcançaram um aumento de mais de 50% no sucesso da tarefa em comparação com os métodos anteriores.

“Este trabalho é um afastamento de como os robôs estão programados hoje. O establishment dos robôs de programação é milhares de horas de tele-operação para ensinar o robô a executar tarefas. Isso é impossível”, disse Choudhury. “Com a rima, estamos nos afastando disso e aprendendo a treinar robôs de uma maneira mais escalável”.

Esta pesquisa foi apoiada pelo Google, Openai, pelo Escritório de Pesquisa Naval dos EUA e pela Nationwide Science Basis.

Leia o trabalho integralmente

Imitação de um tiro sob execução incompatívelAssim, Kushal Kedia, Prithwish Dan, Angela Chao, Maximus Adrian Tempo, Sanjiban Choudhury.


Universidade de Cornell

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *