Exportar registro bibliográfico

Reinforced learning for UAV attitude control (2019)

  • Authors:
  • USP affiliated author: BARBOSA, CAIO AUGUSTO ZAGRIA - EESC
  • School: EESC
  • Sigla do Departamento: SAA
  • Subjects: APRENDIZADO COMPUTACIONAL; CONTROLE DE AERONAVES; SISTEMAS DE CONTROLE; REDES NEURAIS
  • Keywords: Técnicas de controle
  • Language: Inglês
  • Abstract: Transportar pessoas é uma tarefa muito complexa e que exige segurança. Um dos principais problemas é que essa tarefa exige um controlador de atitude extremamente confiável. Entretanto, projetar um controlador de atitude para quadricópteros de alto desempenho e confiabilidade não é uma tarefa trivial, pois seu modelo físico possui um alto grau de complexidade: é desejável que os controladores de vôo para drones de passageiros possam tolerar falhas; adaptar-se às mudanças na carga útil e / ou no ambiente; e otimizar a trajetória de vôo. O desenvolvimento de sistemas inteligentes de controle de vôo é uma área ativa de pesquisa, especificamente através do uso de redes neurais artificiais, uma opção atraente, pois são aproximadores universais e resistentes ao ruído. Através de simulações usando o ambiente de desenvolvimento em Python, estudamos a exatidão e precisão do controle inteligente de atitude treinados usando DDPG (Deep Deterministic Policy Gradients) com Reinforced Learning por AtorCrítico. O sistema de controle RL será dinâmico, alterando as constantes do PID para tentar estabilizar o quadricópter. O ator e o crítico serão 2 redes neurais densamente conectadas e distintas, com 2 camadas ocultas. Os resultados serão comparados com o simples controle PID ajustado usando o método de busca na grade de parâmetros para selecionar os melhores ganhos. Embora nos concentramos especificamente na criação de controladores para um quadricóptero, os métodos desenvolvidos por este trabalho aplicam-se a uma ampla gama de aeronaves não tripuladas com vários rotores e também podem ser estendidos a aeronaves de asa fixa. No final, este trabalho nos mostrou que é possível controlar um quadricóptero usando técnicas de Reinforced Learning. No entanto, o modelo convergiu apenas para ângulos pequenos, o que torna impossível comparar o resultado do PID original com os resultados do controlador RL. No entanto, não podemos dizerque o PID é melhor que o RL ou o contrário é verdadeiro porque a estabilidade do RL e a resposta a condições não lineares, alterações na carga útil e perturbações externas não foram testadas. Para trabalhos futuros, além de testar a estabilidade do controlador RL, é recomendável tentar a pesquisa numa grade de parâmetros para otimizar o hiperparâmetros , bem como a normalização de minilote.
  • Imprenta:

  • Download do texto completo

    Tipo Nome Link
    Versão Publicada Reinforced Learning for U... Direct link
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      BARBOSA, Caio Augusto Zagria. Reinforced learning for UAV attitude control. 2019. Trabalho de Conclusão de Curso (Graduação) – Escola de Engenharia de São Carlos, Universidade de São Paulo, São Carlos, 2019. Disponível em: https://bdta.abcd.usp.br/directbitstream/ce1d9930-6f58-4e4c-9ba6-e76334e2ed82/Reinforced%20Learning%20for%20UAV%20Attitude%20Control.pdf. Acesso em: 29 mar. 2024.
    • APA

      Barbosa, C. A. Z. (2019). Reinforced learning for UAV attitude control (Trabalho de Conclusão de Curso (Graduação). Escola de Engenharia de São Carlos, Universidade de São Paulo, São Carlos. Recuperado de https://bdta.abcd.usp.br/directbitstream/ce1d9930-6f58-4e4c-9ba6-e76334e2ed82/Reinforced%20Learning%20for%20UAV%20Attitude%20Control.pdf
    • NLM

      Barbosa CAZ. Reinforced learning for UAV attitude control [Internet]. 2019 ;[citado 2024 mar. 29 ] Available from: https://bdta.abcd.usp.br/directbitstream/ce1d9930-6f58-4e4c-9ba6-e76334e2ed82/Reinforced%20Learning%20for%20UAV%20Attitude%20Control.pdf
    • Vancouver

      Barbosa CAZ. Reinforced learning for UAV attitude control [Internet]. 2019 ;[citado 2024 mar. 29 ] Available from: https://bdta.abcd.usp.br/directbitstream/ce1d9930-6f58-4e4c-9ba6-e76334e2ed82/Reinforced%20Learning%20for%20UAV%20Attitude%20Control.pdf

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

    Digital Library of Academic Works of Universidade de São Paulo     2012 - 2024