Reinforced learning for UAV attitude control

Barbosa, Caio Augusto Zagria; Bidinotto, Jorge Henrique

Reinforced learning for UAV attitude control (2019)

Authors:
- Barbosa, Caio Augusto Zagria
- Bidinotto, Jorge Henrique (Orientador)
Autor USP: BARBOSA, CAIO AUGUSTO ZAGRIA - EESC
Unidade: EESC
Sigla do Departamento: SAA
Subjects: APRENDIZADO COMPUTACIONAL; CONTROLE DE AERONAVES; SISTEMAS DE CONTROLE; REDES NEURAIS
Keywords: Técnicas de controle
Language: Inglês
Abstract: Transportar pessoas é uma tarefa muito complexa e que exige segurança. Um dos principais problemas é que essa tarefa exige um controlador de atitude extremamente confiável. Entretanto, projetar um controlador de atitude para quadricópteros de alto desempenho e confiabilidade não é uma tarefa trivial, pois seu modelo físico possui um alto grau de complexidade: é desejável que os controladores de vôo para drones de passageiros possam tolerar falhas; adaptar-se às mudanças na carga útil e / ou no ambiente; e otimizar a trajetória de vôo. O desenvolvimento de sistemas inteligentes de controle de vôo é uma área ativa de pesquisa, especificamente através do uso de redes neurais artificiais, uma opção atraente, pois são aproximadores universais e resistentes ao ruído. Através de simulações usando o ambiente de desenvolvimento em Python, estudamos a exatidão e precisão do controle inteligente de atitude treinados usando DDPG (Deep Deterministic Policy Gradients) com Reinforced Learning por AtorCrítico. O sistema de controle RL será dinâmico, alterando as constantes do PID para tentar estabilizar o quadricópter. O ator e o crítico serão 2 redes neurais densamente conectadas e distintas, com 2 camadas ocultas. Os resultados serão comparados com o simples controle PID ajustado usando o método de busca na grade de parâmetros para selecionar os melhores ganhos. Embora nos concentramos especificamente na criação de controladores para um quadricóptero, os métodos desenvolvidos por este trabalho aplicam-se a uma ampla gama de aeronaves não tripuladas com vários rotores e também podem ser estendidos a aeronaves de asa fixa. No final, este trabalho nos mostrou que é possível controlar um quadricóptero usando técnicas de Reinforced Learning. No entanto, o modelo convergiu apenas para ângulos pequenos, o que torna impossível comparar o resultado do PID original com os resultados do controlador RL. No entanto, não podemos dizerque o PID é melhor que o RL ou o contrário é verdadeiro porque a estabilidade do RL e a resposta a condições não lineares, alterações na carga útil e perturbações externas não foram testadas. Para trabalhos futuros, além de testar a estabilidade do controlador RL, é recomendável tentar a pesquisa numa grade de parâmetros para otimizar o hiperparâmetros , bem como a normalização de minilote.
Imprenta:
- Publisher place: São Carlos
- Date published: 2019

Download do texto completo

Tipo	Nome	Link
	Reinforced Learning for U...	Direct link

How to cite

A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

ABNT

BARBOSA, Caio Augusto Zagria. Reinforced learning for UAV attitude control. 2019. Trabalho de Conclusão de Curso (Graduação) – Escola de Engenharia de São Carlos, Universidade de São Paulo, São Carlos, 2019. Disponível em: https://bdta.abcd.usp.br/directbitstream/ce1d9930-6f58-4e4c-9ba6-e76334e2ed82/Reinforced%20Learning%20for%20UAV%20Attitude%20Control.pdf. Acesso em: 16 abr. 2026.
APA

Barbosa, C. A. Z. (2019). Reinforced learning for UAV attitude control (Trabalho de Conclusão de Curso (Graduação). Escola de Engenharia de São Carlos, Universidade de São Paulo, São Carlos. Recuperado de https://bdta.abcd.usp.br/directbitstream/ce1d9930-6f58-4e4c-9ba6-e76334e2ed82/Reinforced%20Learning%20for%20UAV%20Attitude%20Control.pdf
NLM

Barbosa CAZ. Reinforced learning for UAV attitude control [Internet]. 2019 ;[citado 2026 abr. 16 ] Available from: https://bdta.abcd.usp.br/directbitstream/ce1d9930-6f58-4e4c-9ba6-e76334e2ed82/Reinforced%20Learning%20for%20UAV%20Attitude%20Control.pdf
Vancouver

Barbosa CAZ. Reinforced learning for UAV attitude control [Internet]. 2019 ;[citado 2026 abr. 16 ] Available from: https://bdta.abcd.usp.br/directbitstream/ce1d9930-6f58-4e4c-9ba6-e76334e2ed82/Reinforced%20Learning%20for%20UAV%20Attitude%20Control.pdf

BDTA

Exportar registro bibliográfico

Reinforced learning for UAV attitude control (2019)

Download do texto completo

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

USP Schools

BDTA

Exportar registro bibliográfico

Reinforced learning for UAV attitude control (2019)

Download do texto completo

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI: