Sob condições ideais, é fácil pilotar um drone quadcopter. De fato, o design desses veículos aéreos os torna tão estáveis que praticamente voam. Mas no mundo actual, as condições ideais são difíceis de encontrar. Na maioria das vezes, as rajadas de vento e ar turbulento tornam muito difícil manter um drone sob controle, e isso é uma má notícia para tudo, desde serviços autônomos de entrega de pacotes a operações de pesquisa e salvamento que precisam de um olho no céu.
Atualmente, os sistemas de controle de drones simplesmente não conseguem lidar com tudo o que a natureza pode lançar. As coisas geralmente podem correr muito bem, mas alguma situação inevitavelmente surgirá que não foi explicada pelos desenvolvedores do algoritmo, e isso pode significar desastre para o veículo. Esse pode não ser mais o caso no futuro, no entanto, se um trio de engenheiros do MIT tiver o seu caminho. Eles têm trabalhado duro em um nova abordagem Isso permite que os drones mantenham o vôo estável sob condições muito difíceis – mesmo condições que não haviam sido planejadas especificamente para antecedência.
Uma visão geral do meta-aprendizagem offline e dos componentes de controle adaptativo on-line (📷: S. Tang et al.)
O método deles depende de uma técnica de aprendizado chamada Meta-Studying, que ensina essencialmente o sistema a aprender e se adaptar em tempo actual. Isso é feito substituindo suposições anteriores sobre o ambiente pelos modelos aprendidos e também automatizando a seleção do melhor algoritmo para responder a desafios inesperados. Os sistemas de controle tradicionais geralmente exigem que os engenheiros adivinhem com antecedência que tipos de fatores ambientais o drone pode enfrentar. Essa adivinhação é codificada em modelos matemáticos, mas esses modelos podem ficar aquém quando a realidade se desvia das expectativas.
Em vez disso, os pesquisadores construíram uma rede neural que pode aprender o comportamento desses distúrbios a partir de apenas 15 minutos de dados de voo. E o sistema não aprende apenas com os dados – ele também resolve a melhor forma de aprender. Faz isso selecionando o algoritmo de otimização mais adequado de uma família de algoritmos conhecidos como descendência de espelho. Esta é uma atualização significativa sobre técnicas mais convencionais que dependem apenas da descida de gradiente, que é apenas um membro da família Mirror Descent.
Simulações mostram que o novo controlador (azul) melhorou a precisão do rastreamento (📷: S. Tang et al.)
Uma série de simulações e experimentos iniciais mostrou que o novo método de controle atinge uma redução de 50% nos erros de rastreamento de trajetória em comparação com os métodos de linha de base existentes. E o sistema não apenas mantém os drones no caminho mais eficaz, mas seu desempenho realmente melhora à medida que as condições pioram. Em ventos mais fortes – as mesmas situações em que outros métodos de controle tendem a falhar – o novo sistema continua a se adaptar e ter um bom desempenho.
A equipe agora está trabalhando para testar seu sistema em drones reais em ambientes externos. Eles também estão explorando como o método poderia gerenciar cenários mais complexos, como a contabilização da mudança de pesos da carga útil ou o manuseio de vários distúrbios simultâneos. Com algum refinamento com base no resultado desses ensaios, esse sistema de controle pode manter as frotas de drones seguros e em andamento no futuro.