Entrevista com Jean Pierre Sleiman, autor do artigo “Planejamento e controle multicontato versátil para manipulação de locomotivas com pernas”


Entrevista com Jean Pierre Sleiman, autor do artigo “Planejamento e controle multicontato versátil para manipulação de locomotivas com pernas”

Foto de papel “Planejamento e controle multicontato versátil para manipulação de locomotivas com pernas“. © Associação Americana para o Avanço da Ciência

Tivemos a oportunidade de entrevistar Jean Pierre Sleiman, autor do artigo “Versatile multicontact Planning and management for legged loco-manipulation”, recentemente publicado em Robótica Científica.

Qual é o tema da pesquisa em seu artigo?
O tópico de pesquisa concentra-se no desenvolvimento de uma arquitetura de planejamento e controle baseada em modelo que permite que manipuladores móveis com pernas resolvam diversos problemas de manipulação de locomoção (isto é, problemas de manipulação envolvendo inerentemente um elemento de locomoção). Nosso estudo visou especificamente tarefas que exigiriam a resolução de múltiplas interações de contato, em vez de aplicações de escolha e colocação. Para garantir que nossa abordagem não se limite a ambientes de simulação, nós a aplicamos para resolver tarefas do mundo actual com um sistema de pernas que consiste na plataforma quadrúpede ANYmal equipada com DynaArm, um braço robótico 6-DoF personalizado.

Você poderia nos contar sobre as implicações de sua pesquisa e por que ela é uma área interessante para estudo?
A investigação foi motivada pelo desejo de tornar tais robôs, nomeadamente manipuladores móveis com pernas, capazes de resolver uma variedade de tarefas do mundo actual, tais como atravessar portas, abrir/fechar máquinas de lavar louça, manipular válvulas num ambiente industrial, e assim por diante. Uma abordagem padrão teria sido lidar com cada tarefa individualmente e de forma independente, dedicando uma quantidade substancial de esforço de engenharia para criar manualmente os comportamentos desejados:

Isto normalmente é conseguido através do uso de máquinas de estado codificadas nas quais o projetista especifica uma sequência de subobjetivos (por exemplo, segurar a maçaneta da porta, abrir a porta no ângulo desejado, segurar a porta com um dos pés, mover o braço para o outro lado da porta, passar pela porta enquanto a fecha, and so forth.). Alternativamente, um especialista humano pode demonstrar como resolver a tarefa teleoperando o robô, registrando seu movimento e fazendo com que o robô aprenda a imitar o comportamento gravado.

No entanto, esse processo é muito lento, tedioso e sujeito a erros de projeto de engenharia. Para evitar esse fardo a cada nova tarefa, a pesquisa optou por uma abordagem mais estruturada na forma de um planejador único que pode descobrir automaticamente os comportamentos necessários para uma ampla gama de tarefas de manipulação de locomotivas, sem exigir qualquer orientação detalhada para nenhuma delas. .

Você poderia explicar sua metodologia?
O principal perception subjacente à nossa metodologia foi que todas as tarefas de manipulação de locomotivas que pretendíamos resolver podem ser modeladas como problemas de Planejamento de Tarefas e Movimentos (TAMP). TAMP é uma estrutura bem estabelecida que tem sido usada principalmente para resolver problemas de manipulação sequencial onde o robô já possui um conjunto de habilidades primitivas (por exemplo, pegar objeto, posicionar objeto, mover para objeto, lançar objeto, and so forth.), mas ainda tem integrá-los adequadamente para resolver tarefas mais complexas de longo prazo.

Essa perspectiva nos permitiu conceber uma formulação única de otimização de dois níveis que pode abranger todas as nossas tarefas e explorar o conhecimento específico do domínio, em vez do conhecimento específico da tarefa. Combinando isso com os pontos fortes bem estabelecidos de diferentes técnicas de planejamento (otimização de trajetória, busca informada em grafos e planejamento baseado em amostragem), conseguimos alcançar uma estratégia de busca eficaz que resolve o problema de otimização.

A principal novidade técnica em nosso trabalho está na Módulo de planejamento multicontato offlineretratado em Módulo B de Figura 1 no papel. Sua configuração geral pode ser resumida da seguinte forma: Começando com um conjunto definido pelo usuário de efetores finais do robô (por exemplo, pé esquerdo dianteiro, pé direito dianteiro, garra, and so forth.) e recursos de objeto (estes descrevem onde o robô pode interagir com o robô). objeto), um estado discreto que captura a combinação de todos os pares de contato é introduzido. Dado um estado inicial e objetivo (por exemplo, o robô deve terminar atrás da porta), o planejador multicontato resolve então um problema de consulta única, aumentando gradativamente uma árvore por meio de uma pesquisa de dois níveis sobre modos de contato viáveis, juntamente com o robô contínuo. -trajetórias de objetos. O plano resultante é aprimorado com uma única otimização de trajetória de longo horizonte sobre a sequência de contato descoberta.

Quais foram suas principais descobertas?
Descobrimos que nossa estrutura de planejamento foi capaz de descobrir rapidamente planos complexos de múltiplos contatos para diversas tarefas de manipulação de locomotivas, apesar de ter fornecido orientação mínima. Por exemplo, para o cenário de passagem de porta, especificamos as affordances da porta (ou seja, a maçaneta, a superfície traseira e a superfície frontal) e fornecemos apenas um objetivo esparso simplesmente pedindo ao robô que fique atrás da porta. Além disso, descobrimos que os comportamentos gerados são fisicamente consistentes e podem ser executados de forma confiável com um manipulador móvel com pernas reais.

Que trabalho adicional você está planejando nesta área?
Vemos a estrutura apresentada como um trampolim para o desenvolvimento de um pipeline de manipulação de locomotivas totalmente autônomo. No entanto, vemos algumas limitações que pretendemos abordar em trabalhos futuros. Estas limitações estão principalmente ligadas à fase de execução da tarefa, onde o rastreamento de comportamentos gerados com base em ambientes pré-modelados só é viável sob o pressuposto de uma descrição razoavelmente precisa, o que nem sempre é simples de definir.

A robustez para modelar incompatibilidades pode ser bastante melhorada complementando nosso planejador com técnicas baseadas em dados, como aprendizagem por reforço profundo (DRL). Portanto, uma direção interessante para trabalhos futuros seria orientar o treinamento de uma política DRL robusta usando demonstrações confiáveis ​​de especialistas que podem ser rapidamente geradas pelo nosso planejador de manipulação de locomotivas para resolver um conjunto de tarefas desafiadoras com engenharia de recompensa mínima.

Sobre o autor

Jean-Pierre Sleiman recebeu o diploma de BE em engenharia mecânica pela American College of Beirut (AUB), Líbano, em 2016, e o mestrado em automação e controle pelo Politecnico Di Milano, Itália, em 2018. Atualmente é Ph. D. candidato no Robotic Programs Lab (RSL), ETH Zurique, Suíça. Seus atuais interesses de pesquisa incluem planejamento e controle baseados em otimização para manipulação móvel com pernas.




Daniel Carrillo Zapata
obteve seu doutorado em robótica de enxame no Bristol Robotics Lab em 2020. Ele agora promove a cultura da “agitação científica” para se envolver em conversas bidirecionais entre pesquisadores e a sociedade.

Daniel Carrillo-Zapata obteve seu doutorado em robótica de enxame no Bristol Robotics Lab em 2020. Ele agora promove a cultura da “agitação científica” para se envolver em conversas bidirecionais entre pesquisadores e a sociedade.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *