Otimização do jogador de poker por meio do reinforcement learning

Otimização do jogador de poker por meio do reinforcement learning (2009)

Authors:
- Vilella, Rafael Domingues Santos
- Cozman, Fabio Gagliardi (Orientador)
Autor USP: VILELLA, RAFAEL DOMINGUES SANTOS - EP
Unidade: EP
Sigla do Departamento: PMR
Subjects: JOGOS DE COMPUTADOR; ALGORITMOS
Language: Português
Abstract: Baseado nos conceitos de aprendizado por reforço será concebido um algoritmo com o objetivo de maximizar as probabilidades de ganho no jogo de Poker: Heads up Limit Hold'em. Inicialmente será feita uma análise conceitual das informações a serem utilizadas no problema: a base de dados contendo o histórico de diversas jogadas, o custo computacional, os conceitos envolvidos na aprendizagem por reforço e o conhecimento da Psique humana. A partir destes dados será possível fundamentar os modelos de implementação do bot. O primeiro constitui uma aplicação trivial que repete mediamente as jogadas presentes no banco de dados. O segundo, utiliza a técnica de Prioritezed Sweeping e por ultimo um terceiro que é a combinação do Prioritezed Sweeping com a análise em tempo real do oponente.
Imprenta:
- Publisher place: São Paulo
- Date published: 2009

Tipo	Nome	Link
	RAFAEL DOMINGUES SANTOS V...	Direct link

A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

ABNT

VILELLA, Rafael Domingues Santos. Otimização do jogador de poker por meio do reinforcement learning. 2009. Trabalho de Conclusão de Curso (Graduação) – Escola Politécnica, Universidade de São Paulo, São Paulo, 2009. Disponível em: https://bdta.abcd.usp.br/directbitstream/8b901bff-b1a5-4d34-bd58-d4d02ee42f76/RAFAEL%20DOMINGUES%20SANTOS%20VILELLA%20PMR09.pdf. Acesso em: 27 fev. 2026.
APA

Vilella, R. D. S. (2009). Otimização do jogador de poker por meio do reinforcement learning (Trabalho de Conclusão de Curso (Graduação). Escola Politécnica, Universidade de São Paulo, São Paulo. Recuperado de https://bdta.abcd.usp.br/directbitstream/8b901bff-b1a5-4d34-bd58-d4d02ee42f76/RAFAEL%20DOMINGUES%20SANTOS%20VILELLA%20PMR09.pdf
NLM

Vilella RDS. Otimização do jogador de poker por meio do reinforcement learning [Internet]. 2009 ;[citado 2026 fev. 27 ] Available from: https://bdta.abcd.usp.br/directbitstream/8b901bff-b1a5-4d34-bd58-d4d02ee42f76/RAFAEL%20DOMINGUES%20SANTOS%20VILELLA%20PMR09.pdf
Vancouver

Vilella RDS. Otimização do jogador de poker por meio do reinforcement learning [Internet]. 2009 ;[citado 2026 fev. 27 ] Available from: https://bdta.abcd.usp.br/directbitstream/8b901bff-b1a5-4d34-bd58-d4d02ee42f76/RAFAEL%20DOMINGUES%20SANTOS%20VILELLA%20PMR09.pdf