ID3attributiveRules
2796 palavras
12 páginas
Indução de Árvores eRegras Proposicionais de Decisão
Classificação versus Predição (Regressão)
• Classification:
– Afetação a uma classe (rotulo de um atributo categórico)
– Classifica dados (constroi um modelo) baseado em um conjunto de treinamento previamente rotulado e usa o modelo para classificar novas observações.
• Previsão (Regressão):
– Modela funções contínuas; previsão de valores desconhecidos ou ausentes
• Aplicações
– Aprovação de crédito
– Diagnóstico médico
– etc.
Classificação: Um processo em duas etapas
• Construção do Modelo (Aprendisagem): descrição de um conjunto de classes a priori
– Supõe-se que cada observação é oriunda de uma classe predefinida, como indicado pelo atributo rótulo da classe
– Conjunto de treinamento: O conjunto de observações usadas para construir o modelo
– Exemplos de modelos: regras de classificação, árvores de decisão, fórmulas matemáticas
• Uso do modelo: para classificar observações desconhecidas
– Avaliação da precisão do modelo
• O rótulo conhecido de uma observação é comparado com o resultado do modelo (conjunto de teste)
• A taxa de erro é a percentagem de observações do conjunto teste que são classificadas incorretamente pelo modelo
• O conjunto de teste deve ser independente do conjunto de treinamento, senão poderá ocorrer super ajustamento (over-fitting)
Processo de Classificação (1):
Construção do Modelo
Algoritmos de
Classificação
Dados de treinamento NOME
Tonho
Maria
João
José
David
Ana
CATEGORIA
Prof. Assist.
Prof. Assist.
Professor
Prof. Assoc.
Prof. Assist.
Prof. Assoc.
ANOS
3
7
2
7
6
3
Efetivo não sim sim sim não não
Classificador
(Modelo)
IF categoria = ‘professor’
OU Anos > 6
THEN Efetivo = ‘sim’
Processo de Classificação (2): Uso do modelo para a previsão
Classificador
Dados de teste Dados não
(Jeferson, Professor, 4)
NOME
Tonho
Melisa
George
Jose
CATEGORIA
Prof. Assist.
Prof. Assoc.
Professor
Prof. Assist.
ANOS EFETIVO
2
não
7
não
5
sim
7
sim
Efetivo?
Aprendizagem supervisada