Otimização do jogador de poker por meio do reinforcement learning (2009)
- Authors:
- Autor USP: VILELLA, RAFAEL DOMINGUES SANTOS - EP
- Unidade: EP
- Sigla do Departamento: PMR
- Subjects: JOGOS DE COMPUTADOR; ALGORITMOS
- Language: Português
- Abstract: Baseado nos conceitos de aprendizado por reforço será concebido um algoritmo com o objetivo de maximizar as probabilidades de ganho no jogo de Poker: Heads up Limit Hold'em. Inicialmente será feita uma análise conceitual das informações a serem utilizadas no problema: a base de dados contendo o histórico de diversas jogadas, o custo computacional, os conceitos envolvidos na aprendizagem por reforço e o conhecimento da Psique humana. A partir destes dados será possível fundamentar os modelos de implementação do bot. O primeiro constitui uma aplicação trivial que repete mediamente as jogadas presentes no banco de dados. O segundo, utiliza a técnica de Prioritezed Sweeping e por ultimo um terceiro que é a combinação do Prioritezed Sweeping com a análise em tempo real do oponente.
- Imprenta:
-
ABNT
VILELLA, Rafael Domingues Santos. Otimização do jogador de poker por meio do reinforcement learning. 2009. Trabalho de Conclusão de Curso (Graduação) – Escola Politécnica, Universidade de São Paulo, São Paulo, 2009. Disponível em: https://bdta.abcd.usp.br/directbitstream/8b901bff-b1a5-4d34-bd58-d4d02ee42f76/RAFAEL%20DOMINGUES%20SANTOS%20VILELLA%20PMR09.pdf. Acesso em: 26 mar. 2025. -
APA
Vilella, R. D. S. (2009). Otimização do jogador de poker por meio do reinforcement learning (Trabalho de Conclusão de Curso (Graduação). Escola Politécnica, Universidade de São Paulo, São Paulo. Recuperado de https://bdta.abcd.usp.br/directbitstream/8b901bff-b1a5-4d34-bd58-d4d02ee42f76/RAFAEL%20DOMINGUES%20SANTOS%20VILELLA%20PMR09.pdf -
NLM
Vilella RDS. Otimização do jogador de poker por meio do reinforcement learning [Internet]. 2009 ;[citado 2025 mar. 26 ] Available from: https://bdta.abcd.usp.br/directbitstream/8b901bff-b1a5-4d34-bd58-d4d02ee42f76/RAFAEL%20DOMINGUES%20SANTOS%20VILELLA%20PMR09.pdf -
Vancouver
Vilella RDS. Otimização do jogador de poker por meio do reinforcement learning [Internet]. 2009 ;[citado 2025 mar. 26 ] Available from: https://bdta.abcd.usp.br/directbitstream/8b901bff-b1a5-4d34-bd58-d4d02ee42f76/RAFAEL%20DOMINGUES%20SANTOS%20VILELLA%20PMR09.pdf
Download do texto completo
Tipo | Nome | Link | |
---|---|---|---|
RAFAEL DOMINGUES SANTOS V... | Direct link |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas