Simulando multi-agentes em jogos de tabuleiro por turnos, utilizando aprendizagem por reforço via Value-Decomposition Network e Gymnasium API

Feldmann, Jorge de Melo; Osório, Fernando Santos

Simulando multi-agentes em jogos de tabuleiro por turnos, utilizando aprendizagem por reforço via Value-Decomposition Network e Gymnasium API (2023)

Authors:
- Feldmann, Jorge de Melo
- Osório, Fernando Santos (Orientador)
Autor USP: FELDMANN, JORGE DE MELO - ICMC
Unidade: ICMC
Subjects: APRENDIZADO COMPUTACIONAL; INTELIGÊNCIA ARTIFICIAL
Keywords: Videojogo; Jogo digital
Language: Português
Abstract: O mundo dos games é vasto, popular e em constante inovação, sendo um dos mercados onde a inteligência artificial aflora a passos largos. Sob esse contexto, neste trabalho foi desenvolvido um jogo baseado em turnos e tabuleiro que simula caçador e caça, onde foi implementado e analisado o aprendizado por reforço de comportamentos de um sistema multi-agente (com mais de um caçador e uma presa). Buscou-se um aprendizado que valorize a cooperação entre caçadores, na captura da presa. A implementação foi realizada usando o Simulador Gymnasium, com o agentes treinados com o algoritmo Value-Decomposition Network. Foi avaliado o desempenho do algoritmo, baseado em técnicas de Aprendizado de Máquina, treinado através do aprendizado por reforço e auto-treino, através do relato de um experimento, como se dá o processo de preparação, execução e avaliação da curva de aprendizado mediante o algoritmo proposto.
Imprenta:
- Publisher place: São Carlos
- Date published: 2023

Download do texto completo

Tipo	Nome	Link
	Jorge_de_Melo_Feldmann.pd...	Direct link

How to cite

A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

ABNT

FELDMANN, Jorge de Melo. Simulando multi-agentes em jogos de tabuleiro por turnos, utilizando aprendizagem por reforço via Value-Decomposition Network e Gymnasium API. 2023. Trabalho de Conclusão de Curso (MBA) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2023. Disponível em: https://bdta.abcd.usp.br/directbitstream/dbf945da-fa95-45be-9fe1-a531f5b820cb/Jorge_de_Melo_Feldmann.pdf. Acesso em: 18 mar. 2026.
APA

Feldmann, J. de M. (2023). Simulando multi-agentes em jogos de tabuleiro por turnos, utilizando aprendizagem por reforço via Value-Decomposition Network e Gymnasium API (Trabalho de Conclusão de Curso (MBA). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. Recuperado de https://bdta.abcd.usp.br/directbitstream/dbf945da-fa95-45be-9fe1-a531f5b820cb/Jorge_de_Melo_Feldmann.pdf
NLM

Feldmann J de M. Simulando multi-agentes em jogos de tabuleiro por turnos, utilizando aprendizagem por reforço via Value-Decomposition Network e Gymnasium API [Internet]. 2023 ;[citado 2026 mar. 18 ] Available from: https://bdta.abcd.usp.br/directbitstream/dbf945da-fa95-45be-9fe1-a531f5b820cb/Jorge_de_Melo_Feldmann.pdf
Vancouver

Feldmann J de M. Simulando multi-agentes em jogos de tabuleiro por turnos, utilizando aprendizagem por reforço via Value-Decomposition Network e Gymnasium API [Internet]. 2023 ;[citado 2026 mar. 18 ] Available from: https://bdta.abcd.usp.br/directbitstream/dbf945da-fa95-45be-9fe1-a531f5b820cb/Jorge_de_Melo_Feldmann.pdf

BDTA

Exportar registro bibliográfico

Simulando multi-agentes em jogos de tabuleiro por turnos, utilizando aprendizagem por reforço via Value-Decomposition Network e Gymnasium API (2023)

Download do texto completo

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

USP Schools

BDTA

Exportar registro bibliográfico

Simulando multi-agentes em jogos de tabuleiro por turnos, utilizando aprendizagem por reforço via Value-Decomposition Network e Gymnasium API (2023)

Download do texto completo

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI: