O objetivo desse projeto é criar um jogador inteligente de Tetris.
Para isso é utilizado o conceito de aprendizado por reforço, onde a máquina aprende algo sem nenhuma assisteência externa, ou seja, dada apenas um valor para a derrota e outro para a vitória, que no caso é chegar a 200 movimentos sem perder, o algoritmo aprende a jogar por si só, escolhendo novas jogadas tanto para explorar novas oportunidades quanto para aproveitar oportunidades já identificadas como positivas. Ao final desse processo de treinamento, temos uma polītica que consegue escolher um tabuleiro dentre uma lista de opções, e portanto sabe como jogar Tetris!
The goal of this project is to create an intelligent Twtris player.
To make this possible, the reinforcement learning technique is applied. In this technique the machine learns about the game without any outside assistance, given only an arbitrary value for losing the game and another one for winning it, the algorithm learns to play by itself. It chooses new plays based on an explore/exploit technique where it tries to find the best possible plays by itself. By the end of this training, we come up with a policy which is able to choose a specific Tetris board from a list of avaiable boards and thus knows how to play Tetris!
Fontes utilizadas / Sources:
https://webdocs.cs.ualberta.ca/~sutton/book/the-book.html
http://www.cs.cmu.edu/afs/cs/project/ACRL/www/TetrisReports/Breelyn_Eric_Don_Project.pdf