O sistema de controle habilitado para a AI ajuda os drones autônomos a permanecer no alvo em ambientes incertos | MIT Information



O sistema de controle habilitado para a AI ajuda os drones autônomos a permanecer no alvo em ambientes incertos | MIT Information

Um drone autônomo que transporta água para ajudar a extinguir um incêndio na Serra Nevada pode encontrar ventos de Santa Ana que ameaçam sair do curso. A adaptação rápida a esses distúrbios desconhecidos que o bordo apresenta um enorme desafio para o sistema de controle de vôo do drone.

Para ajudar esse drone a permanecer no alvo, os pesquisadores do MIT desenvolveram um novo algoritmo de controle adaptativo baseado em aprendizado de máquina que poderia minimizar seu desvio de sua trajetória pretendida diante de forças imprevisíveis como ventos fortes.

Diferentemente das abordagens padrão, a nova técnica não exige que a pessoa que programa o drone autônoma saiba nada com antecedência sobre a estrutura desses distúrbios incertos. Em vez disso, o modelo de inteligência synthetic do sistema de controle aprende tudo o que precisa saber de uma pequena quantidade de dados observacionais coletados a partir de 15 minutos de tempo de voo.

É importante ressaltar que a técnica determina automaticamente qual algoritmo de otimização deve usar para se adaptar aos distúrbios, o que melhora o desempenho do rastreamento. Ele escolhe o algoritmo que melhor se adapta à geometria de distúrbios específicos que esse drone está enfrentando.

Os pesquisadores treinam seu sistema de controle para fazer as duas coisas simultaneamente usando uma técnica chamada Meta-Studying, que ensina o sistema a se adaptar a diferentes tipos de distúrbios.

Tomados em conjunto, esses ingredientes permitem que seu sistema de controle adaptativo atinja 50 % menos erro de rastreamento de trajetória do que os métodos de linha de base nas simulações e tenha um desempenho melhor com novas velocidades de vento que não viu durante o treinamento.

No futuro, esse sistema de controle adaptativo poderia ajudar os drones autônomos a oferecer parcelas pesadas com mais eficiência, apesar dos ventos fortes ou a monitorar áreas propensas a incêndio de um parque nacional.

“O aprendizado simultâneo desses componentes é o que dá ao nosso método sua força. Ao alavancar a meta-aprendizagem, nosso controlador pode fazer automaticamente escolhas que serão melhores para adaptação rápida”, diz Navid Azizan, que é a Ester e a HAROLD E. Edgerton Professor no Departamento de Engenharia Mecânica e do Instituto, Sistemas, Sistemas e Sociedades) (Ids), o Mechoratation Investor (Idss Society), para o Mechoratation, Satoratator, que é um professor assistente do MAT, o Mechanical Engineering and the Institute para Minoros, sistemas e sociedades (Ids), como um dos principais sistemas, o Satoratation Saturator, que é um professor assistente do MECIRAGEM, para o Sistema de Sistemas e Sociedades, Sociedade de Sistemas, Ids. (Tampas) e o autor sênior de um papel Neste sistema de controle.

Azizan é acompanhado no artigo pelo autor principal Sunbochen Tang, um estudante de graduação do Departamento de Aeronáutica e Astronautica, e Haoyuan Solar, um estudante de pós -graduação no Departamento de Engenharia Elétrica e Ciência da Computação. A pesquisa foi apresentada recentemente na Conferência de Aprendizagem para Dinâmica e Controle.

Encontrando o algoritmo certo

Normalmente, um sistema de controle incorpora uma função que modela o drone e seu ambiente e inclui algumas informações existentes sobre a estrutura de possíveis distúrbios. Mas, em um mundo actual cheio de condições incertas, geralmente é impossível designar essa estrutura com antecedência.

Muitos sistemas de controle usam um método de adaptação baseado em um algoritmo de otimização in style, conhecido como descida de gradiente, para estimar as partes desconhecidas do problema e determinar como manter o drone o mais próximo possível de sua trajetória alvo durante o vôo. No entanto, a ascendência de gradiente é apenas um algoritmo em uma família maior de algoritmos disponíveis para escolher, conhecida como descendência de espelho.

“Descendência espelhada é uma família geral de algoritmos e, para qualquer problema, um desses algoritmos pode ser mais adequado que outros. O nome do jogo é como escolher o algoritmo específico que é certo para o seu problema. Em nosso método, automatizamos essa escolha”, diz Azizan.

Em seu sistema de controle, os pesquisadores substituíram a função que contém alguma estrutura de possíveis distúrbios com um modelo de rede neural que aprende a aproximá -los dos dados. Dessa forma, eles não precisam ter uma estrutura a priori da velocidade do vento que esse drone pode encontrar com antecedência.

O método deles também usa um algoritmo para selecionar automaticamente a função de descecente espelho direita ao mesmo tempo, enquanto aprende o modelo de rede neural a partir de dados, em vez de assumir que um usuário já possui a função preferrred escolhida. Os pesquisadores dão a esse algoritmo uma variedade de funções para escolher, e encontra o que melhor se encaixa no problema em questão.

“Escolher uma boa função de geração de distância para construir a adaptação de descendência espelhada direita é muito importante para obter o algoritmo certo para reduzir o erro de rastreamento”, acrescenta Tang.

Aprendendo a se adaptar

Enquanto o vento acelera o drone pode encontrar toda vez que voa, a rede neural e a função espelhada do controlador devem permanecer iguais para que não precisem ser recalculadas a cada vez.

Para tornar seu controlador mais flexível, os pesquisadores usam meta-aprendizagem, ensinando-o a se adaptar, mostrando uma série de famílias de velocidade do vento durante o treinamento.

“Nosso método pode lidar com objetivos diferentes porque, usando meta-aprendizagem, podemos aprender uma representação compartilhada através de diferentes cenários com eficiência com dados”, explica Tang.

No closing, o usuário alimenta o sistema de controle uma trajetória de destino e recalcula continuamente, em tempo actual, como o drone deve produzir impulso para mantê-lo o mais próximo possível dessa trajetória e acomodar o distúrbio incerto que encontra.

Nas simulações e experimentos do mundo actual, os pesquisadores mostraram que seu método levou a um erro de rastreamento significativamente menor do que as abordagens de linha de base a cada velocidade do vento que testaram.

“Mesmo que os distúrbios do vento sejam muito mais fortes do que vimos durante o treinamento, nossa técnica mostra que ainda pode lidar com eles com sucesso”, acrescenta Azizan.

Além disso, a margem pela qual seu método superou as linhas de base cresceu à medida que a velocidade do vento se intensificou, mostrando que pode se adaptar a ambientes desafiadores.

A equipe agora está realizando experimentos de {hardware} para testar seu sistema de controle em drones reais com diferentes condições de vento e outros distúrbios.

Eles também desejam estender seu método para que ele possa lidar com distúrbios de várias fontes ao mesmo tempo. Por exemplo, a alteração da velocidade do vento pode causar o peso de um pacote que o drone está transportando para mudar de voo, especialmente quando o drone está carregando cargas úteis.

Eles também querem explorar o aprendizado contínuo, para que o drone possa se adaptar a novos distúrbios sem a necessidade de ser treinado nos dados que viu até agora.

“Navid and his collaborators have developed breakthrough work that mixes meta-learning with typical adaptive management to study nonlinear options from information. Key to their method is the usage of mirror descent strategies that exploit the underlying geometry of the issue in methods prior artwork couldn’t. Their work can contribute considerably to the design of autonomous techniques that have to function in advanced and unsure environments,” says Babak Hassibi, the Mose and Lillian S. Professor de Bohn de Engenharia Elétrica e Computação e Ciências Matemáticas da Caltech, que não estava envolvido com este trabalho.

Esta pesquisa foi apoiada, em parte, por Mathworks, o MIT-IBM Watson AI Lab, o MIT-Amazon Science Hub e o Programa MIT-Google para Compunciar Inovação.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *