Aprendizado por reforço
Inteligência Artificial
Aprendizado por Reforço
Vinícius Matos
Índice
Apresentação;
Aprendizado;
Aprendizado por reforço;
Definição;
Case : Jogo da Velha;
AR x Min-Max;
AR1 x AR2;
Conclusões;
Referências;
Agradecimentos;
Aprendizado
Aquisição de conceitos e conhecimentos estruturados;
Pode ocorrer com ou sem presença de tutor;
O estudo do aprendizado pela máquina, é
fundamental área da IA;
Pode usar o mecanismo de punição e recompensa, no processo, onde o retorno do supervisor depende das ações certas ou erradas do supervisionado.
Definição – Aprendizado por reforço
Técnica de aprendizagem onde os agentes recebem
recompensas e punições a partir da realização de determinada ação;
Interação entre o sistema de aprendizagem e seu ambiente; Aprendizagem através do conhecimento sobre o estado decorrente de das ações;
Experiência, como tutora.
Definição – Aprendizado por reforço
O fato de tal interação sem tutor, torna a
aprendizagem por reforço atrativa para ambientes dinâmicos; Inicialmente, o agente não precisa saber as ações que deve tomar e sim as que obtêm maiores valores de retorno; Aplicação no clássico Jogo da Velha, abaixo:
Jogo da Velha (Tic-Tac-Toe)
Máquina realiza treinamento utilizando aprendizagem por
reforço;
Adquire-se capacidade de jogar com boas estratégias, aprendidas no treinamento;
Capacidade de jogar contra computadores e até humanos;
Comparações (usando MATLAB***):
AR* x Min-Max**;
AR1 x AR2.
*AR – Máquina aprendendo por reforço;
** Min-Max – Máquina utilizando técnica Min-Max;
*** MATLAB - software interativo de alta performance integra análise numérica, cálculo com matrizes, processamento de sinais e construção de gráficos.
AR x Min-Max
Min-Max iniciando o jogo, tanto com profundidade de 1 ou
2 jogadas a frente, não é possível vencê-lo. No máximo empate; Nota-se que