Otimização utilizando o Algoritmo das Abelhas de hiperparâmetros do método Advantage Actor-Critic com treinamento limitado (2023)
- Authors:
- Autor USP: SINOARA, GUILHERME HIROSHI - ICMC
- Unidade: ICMC
- DOI: 10.11606/003189822
- Subjects: ALGORITMOS GENÉTICOS; INTELIGÊNCIA ARTIFICIAL; OTIMIZAÇÃO MATEMÁTICA
- Keywords: Aprendizado por reforço; Hiperparâmetros; Advantage Actor-Critic; Meta-heurística; Algoritmo das Abelhas
- Language: Português
- Abstract: As técnicas de aprendizado por reforço geralmente requerem muitos dados para que apresentem um resultado satisfatório. Neste trabalho foi utilizado o Algoritmo das Abelhas para otimização de hiperparâmetros do método Advantage Actor-Critic para obter um desempenho aceitável utilizando um número limitado de episódios no ambiente Cart Pole. É proposta uma metodologia para avaliação dos conjuntos de hiperparâmetros encontrados baseada no treinamento e avaliação de múltiplos agentes. Os resultados mostram que, embora seja necessário cuidado em como os hiperparâmetros são avaliados, é possível conseguir agentes que apresentam bons resultados com poucos episódios de treinamento utilizando o Algoritmo das Abelhas.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2023
- Este periódico é de acesso aberto
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: gold
- Licença: cc-by-nc-sa
-
ABNT
SINOARA, Guilherme Hiroshi. Otimização utilizando o Algoritmo das Abelhas de hiperparâmetros do método Advantage Actor-Critic com treinamento limitado. 2023. Trabalho de Conclusão de Curso (MBA) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2023. Disponível em: https://doi.org/10.11606/003189822. Acesso em: 13 jan. 2026. -
APA
Sinoara, G. H. (2023). Otimização utilizando o Algoritmo das Abelhas de hiperparâmetros do método Advantage Actor-Critic com treinamento limitado (Trabalho de Conclusão de Curso (MBA). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. Recuperado de https://doi.org/10.11606/003189822 -
NLM
Sinoara GH. Otimização utilizando o Algoritmo das Abelhas de hiperparâmetros do método Advantage Actor-Critic com treinamento limitado [Internet]. 2023 ;[citado 2026 jan. 13 ] Available from: https://doi.org/10.11606/003189822 -
Vancouver
Sinoara GH. Otimização utilizando o Algoritmo das Abelhas de hiperparâmetros do método Advantage Actor-Critic com treinamento limitado [Internet]. 2023 ;[citado 2026 jan. 13 ] Available from: https://doi.org/10.11606/003189822
Informações sobre o DOI: 10.11606/003189822 (Fonte: oaDOI API)
Download do texto completo
| Tipo | Nome | Link | |
|---|---|---|---|
| Guilherme Hiroshi Sinoara... | Direct link |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
