Weka
Jacques Robin
João Batista
Marcelino Pereira
junho/2001
Roteiro
Introdução
Conceitos
Exemplos práticos
Chamada ao aplicativo
WEKA
Universidade de Waikato - Nova Zelândia
Waikato Environment for Knowledge Analysis
Coleção de algoritmos de aprendizagem de máquina para resolução de problemas de Data
Mining
implementado em Java
open source software
http://www.cs.waikato.ac.nz/ml/weka/
Métodos de aprendizagem suportados
decision tree inducers
rule learners
naive Bayes
decision tables
locally weighted regression
support vector machines
instance-based learners
logistic regression
voted perceptrons
Origem dos Dados
Arquivo local no formato .arf
Arquivo em URL no formato .arf
Tabelas de Banco de Dados via JDBC
Preparando os dados
O weka lê os dados no formato .arf
• Uma lista de todas as instâncias, onde o valor dos atributos são separados por vírgula mais um cabeçalho
Ex(weather.arf):
@relation weather
%Nome do arquivo
@attribute outlook {sunny, overcast, rainy}
@attribute temperature real %Atributo e tipo
@attribute humidity real
@attribute windy {TRUE, FALSE}
@attribute play {yes, no}
@data
%Início dos dados sunny,85,85,FALSE,no overcast,83,86,FALSE,yes
Weka: Aprendizado de árvores de decisão
Dados do tempo
Algoritmo weka.classifier.j48.J48
>75
<=75
Aprendizado de árvores de decisão
J48 pruned tree
-----------------outlook = sunny
|
humidity <= 75: yes (2.0)
|
humidity > 75: no (3.0) outlook = overcast: yes (4.0) outlook = rainy
|
windy = TRUE: no (2.0)
|
windy = FALSE: yes (3.0)
Number of Leaves
:
Size of the tree :
5
8
Gerando regras de associação
APRIORI
Algoritmo para minerar regras de associação.
IF
IF
IF
IF
IF
IF
IF
umidade = normal AND vento = não THEN jogar = sim umidade = normal AND jogar = sim THEN vento = não vento = não AND jogar = sim THEN umidade = normal umidade = normal THEN vento = não AND jogar = sim vento = não THEN umidade =