Otimização utilizando o Algoritmo das Abelhas de hiperparâmetros do método Advantage Actor-Critic com treinamento limitado (2023)
- Authors:
- Autor USP: SINOARA, GUILHERME HIROSHI - ICMC
- Unidade: ICMC
- Subjects: ALGORITMOS GENÉTICOS; INTELIGÊNCIA ARTIFICIAL; OTIMIZAÇÃO MATEMÁTICA
- Keywords: Aprendizado por reforço; Hiperparâmetros; Advantage Actor-Critic; Meta-heurística; Algoritmo das Abelhas
- Language: Português
- Abstract: As técnicas de aprendizado por reforço geralmente requerem muitos dados para que apresentem um resultado satisfatório. Neste trabalho foi utilizado o Algoritmo das Abelhas para otimização de hiperparâmetros do método Advantage Actor-Critic para obter um desempenho aceitável utilizando um número limitado de episódios no ambiente Cart Pole. É proposta uma metodologia para avaliação dos conjuntos de hiperparâmetros encontrados baseada no treinamento e avaliação de múltiplos agentes. Os resultados mostram que, embora seja necessário cuidado em como os hiperparâmetros são avaliados, é possível conseguir agentes que apresentam bons resultados com poucos episódios de treinamento utilizando o Algoritmo das Abelhas.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2023
-
ABNT
SINOARA, Guilherme Hiroshi. Otimização utilizando o Algoritmo das Abelhas de hiperparâmetros do método Advantage Actor-Critic com treinamento limitado. 2023. Trabalho de Conclusão de Curso (MBA) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2023. Disponível em: https://bdta.abcd.usp.br/directbitstream/c95c5b78-c756-4d43-8298-94d7ef812b7b/Guilherme%20Hiroshi%20Sinoara.pdf. Acesso em: 21 mar. 2025. -
APA
Sinoara, G. H. (2023). Otimização utilizando o Algoritmo das Abelhas de hiperparâmetros do método Advantage Actor-Critic com treinamento limitado (Trabalho de Conclusão de Curso (MBA). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. Recuperado de https://bdta.abcd.usp.br/directbitstream/c95c5b78-c756-4d43-8298-94d7ef812b7b/Guilherme%20Hiroshi%20Sinoara.pdf -
NLM
Sinoara GH. Otimização utilizando o Algoritmo das Abelhas de hiperparâmetros do método Advantage Actor-Critic com treinamento limitado [Internet]. 2023 ;[citado 2025 mar. 21 ] Available from: https://bdta.abcd.usp.br/directbitstream/c95c5b78-c756-4d43-8298-94d7ef812b7b/Guilherme%20Hiroshi%20Sinoara.pdf -
Vancouver
Sinoara GH. Otimização utilizando o Algoritmo das Abelhas de hiperparâmetros do método Advantage Actor-Critic com treinamento limitado [Internet]. 2023 ;[citado 2025 mar. 21 ] Available from: https://bdta.abcd.usp.br/directbitstream/c95c5b78-c756-4d43-8298-94d7ef812b7b/Guilherme%20Hiroshi%20Sinoara.pdf
Download do texto completo
Tipo | Nome | Link | |
---|---|---|---|
Guilherme Hiroshi Sinoara... | Direct link |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas