Deep reinforcement learning for simulated autonomous drone control (2020)
- Authors:
- Autor USP: PIMENTA, ARTHUR MORIGGI - EP
- Unidade: EP
- Sigla do Departamento: PMR
- Subjects: AERONAVES NÃO TRIPULADAS; SIMULINK
- Language: Inglês
- Abstract: Com o aumento recenete no número de aplicações envolvendo drones, algoritmos dedicados ao controle de quadricópteros ganharam relevância. Um dos algoritmos de controle mais comum é o Proporcional, Integrativo e Derivativo, o PID. No entanto, pesquisas recentes afirmam que algoritmos de Deep Reinforcement Learning, como o Proximal Policy Optimization (PPO), apresentam resultados satisfatórios na tarefa de controle, podendo ser ainda melhores que o PID para condições extremas. Nesse contexto, desenvolvemos e comparamos os modelos de PID e PPO com o objetivo de controlar a atitude de um drone. Os ganhos do PID foram calculados através do método Lugar das Raízes e o modelo foi desenvolvido e simulado no software SIMULINK. O modelo PPO foi desenvolvido em python com a biblioteca Stable Baselines e o ambiente de treinamento do agente foi implementado com base nos padrões de ambiente GYM. O conjunto de hiperparâmetros e a função de recompensa utilizados no treinamento do modelo PPO foram inspirados no conjunto utilizado para treinar o ambiente Pendulum disponível no GYM. Os resultados obtidos mostram que em situações que exigem pequenas variações angulares, ambos modelos obtiveram resultados bons e similares, enquanto que em condições extremas, como partir de cabeça para baixo até 30 graus de atitude, o PPO se mostrou consideravelmente melhor e mais robusto do que o PID.
- Imprenta:
-
ABNT
PIMENTA, Arthur Moriggi. Deep reinforcement learning for simulated autonomous drone control. 2020. Trabalho de Conclusão de Curso (Graduação) – Escola Politécnica, Universidade de São Paulo, São Paulo, 2020. Disponível em: https://bdta.abcd.usp.br/directbitstream/a95f38c4-11a0-444a-a6e3-078da6424e8d/ARTHUR%20MORIGGI%20PIMENTA%20TCC20.pdf. Acesso em: 20 mar. 2025. -
APA
Pimenta, A. M. (2020). Deep reinforcement learning for simulated autonomous drone control (Trabalho de Conclusão de Curso (Graduação). Escola Politécnica, Universidade de São Paulo, São Paulo. Recuperado de https://bdta.abcd.usp.br/directbitstream/a95f38c4-11a0-444a-a6e3-078da6424e8d/ARTHUR%20MORIGGI%20PIMENTA%20TCC20.pdf -
NLM
Pimenta AM. Deep reinforcement learning for simulated autonomous drone control [Internet]. 2020 ;[citado 2025 mar. 20 ] Available from: https://bdta.abcd.usp.br/directbitstream/a95f38c4-11a0-444a-a6e3-078da6424e8d/ARTHUR%20MORIGGI%20PIMENTA%20TCC20.pdf -
Vancouver
Pimenta AM. Deep reinforcement learning for simulated autonomous drone control [Internet]. 2020 ;[citado 2025 mar. 20 ] Available from: https://bdta.abcd.usp.br/directbitstream/a95f38c4-11a0-444a-a6e3-078da6424e8d/ARTHUR%20MORIGGI%20PIMENTA%20TCC20.pdf
Download do texto completo
Tipo | Nome | Link | |
---|---|---|---|
ARTHUR MORIGGI PIMENTA TC... | Direct link |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas