Ia - aprendizado por reforço
Inteligência Artificial Aprendizado por Reforço
Vinícius
Índice
Apresentação; Aprendizado; Aprendizado por reforço;
Definição; Case : Jogo da Velha;
AR x Min-Max; AR1 x AR2;
Conclusões; Referências; Agradecimentos;
Aprendizado
Aquisição de conceitos e conhecimentos estruturados; Pode ocorrer com ou sem presença de tutor; O estudo do aprendizado pela máquina, é fundamental área da IA; Pode usar o mecanismo de punição e recompensa, no processo, onde o retorno do supervisor depende das ações certas ou erradas do supervisionado.
Definição – Aprendizado por reforço
Técnica de aprendizagem onde os agentes recebem recompensas e punições a partir da realização de determinada ação; Interação entre o sistema de aprendizagem e seu ambiente; Aprendizagem através do conhecimento sobre o estado decorrente de das ações; Experiência, como tutora.
Definição – Aprendizado por reforço
O fato de tal interação sem tutor, torna a aprendizagem por reforço atrativa para ambientes dinâmicos; Inicialmente, o agente não precisa saber as ações que deve tomar e sim as que obtêm maiores valores de retorno; Aplicação no clássico Jogo da Velha, abaixo:
Jogo da Velha (Tic-Tac-Toe)
Máquina realiza treinamento utilizando aprendizagem por reforço; Adquire-se capacidade de jogar com boas estratégias, aprendidas no treinamento; Capacidade de jogar contra computadores e até humanos; Comparações (usando MATLAB***):
AR* x Min-Max**; AR1 x AR2.
*AR – Máquina aprendendo por reforço; ** Min-Max – Máquina utilizando técnica Min-Max; *** MATLAB - software interativo de alta performance integra análise numérica, cálculo com matrizes, processamento de sinais e construção de gráficos.
AR x Min-Max
Min-Max iniciando o jogo, tanto com profundidade de 1 ou 2 jogadas a frente, não é possível vencê-lo. No máximo empate;
Nota-se que mesmo alterando quantidade de partidas, o percentual de empate se estabilizou em 70 % no final do treinamento.