mineracao dados
O Weka está implementado na linguagem Java, que tem como principal característica ser portável, desta forma pode rodar nas mais variadas plataformas e aproveitando os benefícios de uma linguagem orientada a objetos como modularidade, polimorfismo, encapsulamento, reutilização de código dentre outros, além disso é um software de domínio público estando disponível em http://www.cs.waikato.ac.nz/ml/weka/ .
Abaixo temos alguns métodos implementados no Weka:
Métodos de classificação
árvore de decisão induzida regras de aprendizagem naive Bayes tabelas de decisão regressão local de pesos aprendizado baseado em instância regressão lógica perceptron perceptron multicamada comitê de perceptrons
SVM
Métodos para predição numérica
regressão linear geradores de árvores modelo regressão local de pesos aprendizado baseado em instância tabelas de decisão perceptron multicamadas
Arquivo ARFF
Suponhamos que tenhamos alguns dados para gerar regras de associação, para que isso seja possível temos que armazenar esses dados de alguma forma que pode ser na forma de uma planilha ou de um banco de dados.
O Weka possui um formato próprio o ARFF, o qual temos que descrever o domínio do atributo, pois o mesmo não pode ser obtido automaticamente pelo seu valor.
Antes de aplicar os dados a qualquer algoritmo do pacote Weka estes devem ser convertidos para o formato ARFF que consiste basicamente de duas partes. A primeira contém uma lista de todos os atributos, onde devemos definir o tipo do atributo ou os valores que ele pode representar, quando utilizamos os valores estes devem estar entre “{ }“ separados por vírgulas. A segunda parte consiste das instâncias, ou seja, os registros a serem minerados com o valor dos atributos para cada instancia separado por vírgula, a