Simulando multi-agentes em jogos de tabuleiro por turnos, utilizando aprendizagem por reforço via Value-Decomposition Network e Gymnasium API (2023)
- Authors:
- Autor USP: FELDMANN, JORGE DE MELO - ICMC
- Unidade: ICMC
- Subjects: APRENDIZADO COMPUTACIONAL; INTELIGÊNCIA ARTIFICIAL
- Keywords: Videojogo; Jogo digital
- Language: Português
- Abstract: O mundo dos games é vasto, popular e em constante inovação, sendo um dos mercados onde a inteligência artificial aflora a passos largos. Sob esse contexto, neste trabalho foi desenvolvido um jogo baseado em turnos e tabuleiro que simula caçador e caça, onde foi implementado e analisado o aprendizado por reforço de comportamentos de um sistema multi-agente (com mais de um caçador e uma presa). Buscou-se um aprendizado que valorize a cooperação entre caçadores, na captura da presa. A implementação foi realizada usando o Simulador Gymnasium, com o agentes treinados com o algoritmo Value-Decomposition Network. Foi avaliado o desempenho do algoritmo, baseado em técnicas de Aprendizado de Máquina, treinado através do aprendizado por reforço e auto-treino, através do relato de um experimento, como se dá o processo de preparação, execução e avaliação da curva de aprendizado mediante o algoritmo proposto.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2023
-
ABNT
FELDMANN, Jorge de Melo. Simulando multi-agentes em jogos de tabuleiro por turnos, utilizando aprendizagem por reforço via Value-Decomposition Network e Gymnasium API. 2023. Trabalho de Conclusão de Curso (MBA) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2023. Disponível em: https://bdta.abcd.usp.br/directbitstream/dbf945da-fa95-45be-9fe1-a531f5b820cb/Jorge_de_Melo_Feldmann.pdf. Acesso em: 19 maio 2025. -
APA
Feldmann, J. de M. (2023). Simulando multi-agentes em jogos de tabuleiro por turnos, utilizando aprendizagem por reforço via Value-Decomposition Network e Gymnasium API (Trabalho de Conclusão de Curso (MBA). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. Recuperado de https://bdta.abcd.usp.br/directbitstream/dbf945da-fa95-45be-9fe1-a531f5b820cb/Jorge_de_Melo_Feldmann.pdf -
NLM
Feldmann J de M. Simulando multi-agentes em jogos de tabuleiro por turnos, utilizando aprendizagem por reforço via Value-Decomposition Network e Gymnasium API [Internet]. 2023 ;[citado 2025 maio 19 ] Available from: https://bdta.abcd.usp.br/directbitstream/dbf945da-fa95-45be-9fe1-a531f5b820cb/Jorge_de_Melo_Feldmann.pdf -
Vancouver
Feldmann J de M. Simulando multi-agentes em jogos de tabuleiro por turnos, utilizando aprendizagem por reforço via Value-Decomposition Network e Gymnasium API [Internet]. 2023 ;[citado 2025 maio 19 ] Available from: https://bdta.abcd.usp.br/directbitstream/dbf945da-fa95-45be-9fe1-a531f5b820cb/Jorge_de_Melo_Feldmann.pdf
Download do texto completo
Tipo | Nome | Link | |
---|---|---|---|
Jorge_de_Melo_Feldmann.pd... | Direct link |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas