Exportar registro bibliográfico


Metrics:

Otimização utilizando o Algoritmo das Abelhas de hiperparâmetros do método Advantage Actor-Critic com treinamento limitado (2023)

  • Authors:
  • Autor USP: SINOARA, GUILHERME HIROSHI - ICMC
  • Unidade: ICMC
  • DOI: 10.11606/003189822
  • Subjects: ALGORITMOS GENÉTICOS; INTELIGÊNCIA ARTIFICIAL; OTIMIZAÇÃO MATEMÁTICA
  • Keywords: Aprendizado por reforço; Hiperparâmetros; Advantage Actor-Critic; Meta-heurística; Algoritmo das Abelhas
  • Language: Português
  • Abstract: As técnicas de aprendizado por reforço geralmente requerem muitos dados para que apresentem um resultado satisfatório. Neste trabalho foi utilizado o Algoritmo das Abelhas para otimização de hiperparâmetros do método Advantage Actor-Critic para obter um desempenho aceitável utilizando um número limitado de episódios no ambiente Cart Pole. É proposta uma metodologia para avaliação dos conjuntos de hiperparâmetros encontrados baseada no treinamento e avaliação de múltiplos agentes. Os resultados mostram que, embora seja necessário cuidado em como os hiperparâmetros são avaliados, é possível conseguir agentes que apresentam bons resultados com poucos episódios de treinamento utilizando o Algoritmo das Abelhas.
  • Imprenta:
  • Versão PublicadaAcesso à fonteDOI
    Informações sobre o DOI: 10.11606/003189822 (Fonte: oaDOI API)
    • Este periódico é de acesso aberto
    • Este artigo é de acesso aberto
    • URL de acesso aberto
    • Cor do Acesso Aberto: gold
    • Licença: cc-by-nc-sa

    Download do texto completo

    Tipo Nome Link
    Versão Publicada Guilherme Hiroshi Sinoara... Direct link
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      SINOARA, Guilherme Hiroshi. Otimização utilizando o Algoritmo das Abelhas de hiperparâmetros do método Advantage Actor-Critic com treinamento limitado. 2023. Trabalho de Conclusão de Curso (MBA) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2023. Disponível em: https://doi.org/10.11606/003189822. Acesso em: 13 jan. 2026.
    • APA

      Sinoara, G. H. (2023). Otimização utilizando o Algoritmo das Abelhas de hiperparâmetros do método Advantage Actor-Critic com treinamento limitado (Trabalho de Conclusão de Curso (MBA). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. Recuperado de https://doi.org/10.11606/003189822
    • NLM

      Sinoara GH. Otimização utilizando o Algoritmo das Abelhas de hiperparâmetros do método Advantage Actor-Critic com treinamento limitado [Internet]. 2023 ;[citado 2026 jan. 13 ] Available from: https://doi.org/10.11606/003189822
    • Vancouver

      Sinoara GH. Otimização utilizando o Algoritmo das Abelhas de hiperparâmetros do método Advantage Actor-Critic com treinamento limitado [Internet]. 2023 ;[citado 2026 jan. 13 ] Available from: https://doi.org/10.11606/003189822

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

    Biblioteca Digital de Trabalhos Acadêmicos da Universidade de São Paulo     2012 - 2026