Android
APRENDIZADO POR REFORÇO PARA AGENTES INTELIGENTES
Karla Figueiredo∗
Marley Vellasco†
karla@uerj.br
marley@ele.puc-rio.br
Marco Pacheco†
Flávio Souza‡
marco@ele.puc-rio.br
fsouza@uerj.br
∗
Departamento de Engenharia Eletrônica
Universidade Estadual do Rio de Janeiro
Rua São Francisco Xavier, 524 - Rio de Janeiro, 20550-900 RJ Brasil
†
Departamento de Engenharia Elétrica
Pontifícia Universidade Católica do Rio de Janeiro
Rua Marquês de São Vicente, 225, Rio de Janeiro - 22453-900 RJ Brasil
‡
Departamento de Engenharia de Sistemas e Computação
Universidade Estadual do Rio de Janeiro
Rua São Francisco Xavier, 524 - Rio de Janeiro, 20550-900 RJ Brasil
RESUMO
Este trabalho apresenta um novo modelo híbrido neuro-fuzzy para aprendizado automático de ações efetuadas por agentes. O objetivo do modelo é dotar um agente de inteligência, tornando-o capaz de, através da interação com o seu ambiente, adquirir e armazenar o conhecimento e raciocinar (inferir uma ação). Este novo modelo, denominado
Reinforcement Learning Neuro-Fuzzy Hierárquico Politree
(RL-NFHP), descende dos modelos neuro-fuzzy hierárquicos NFHB, os quais utilizam aprendizado supervisionado e particionamento BSP (Binary Space Partitioning) do espaço de entrada. Com o uso desse método hierárquico de particionamento, associado ao Reinforcement Learning, obteve-se uma nova classe de Sistemas Neuro-Fuzzy (SNF) que execuARTIGO CONVIDADO:
Versão completa e revisada de artigo apresentado no SBAI-2005
Artigo submetido em 01/06/2006
1a. Revisão em 28/08/2006
2a. Revisão em 07/03/2007
Aceito sob recomendação do Editor Convidado
Prof. Osvaldo Ronald Saavedra Mendez
234
tam, além do aprendizado da estrutura, o aprendizado autônomo das ações a serem tomadas por um agente. Essas características representam um importante diferencial em relação aos sistemas de aprendizado de agentes inteligentes existentes. O modelo