Mineração de dados utilizando a ferramente weka
6141 palavras
25 páginas
MINERAÇÃO DE DADOSCLASSIFICAÇÃO E ASSOCIAÇÃO UTILIZANDO A FERRAMENTA WEKA
DAYANE ROCHA, ÍCARO GABRIEL, IULI MELO
RIO BRANCO, MARÇO DE 2013 1. INTRODUÇÃO
O trabalho aqui descrito equivale a parcial N1 da disciplina de Sistemas de Apoio a Decisão, que tem por objetivo realizar experimentos de mineração de dados, aplicando técnicas em bases de dados reais, realizando nelas as atividades de classificação e associação.
O relatório apresentado descreve detalhadamente as base utilizadas no experimento e mostra os resultados obtidos
A seção 2 se refere as atividades de classificação e a seção 3 se refere aos experimentos de associação.
O experimento foi realizado utilizando a base de dados zoo disponibilizada pela UCI (University of California, Irvine) no repositório de seu centro de aprendizado de máquina e sistemas inteligentes. A ferramenta utilizada para a tarefa de mineração foi a Weka (Waikato Environment for Knowledge Analysis) em sua versão 3.7.8. O ambiente computacional foi uma plataforma notebook, com processador Intel® Pentium Dual Core 2.2 Ghz, com disco de 160Gb de espaço disponível, memória RAM de 2Gb e sistema operacional Microsoft® Windows 7 32 bits.
2. CLASSIFICAÇÃO
3.1 ENUNCIADO
Escolher uma base de dados disponível no repositório da UCI (University of California, Irvine): http://www.ics.uci.edu/~mlearn/MLSummary.html ou www.dados.gov.br e executar pelo menos duas técnicas de classificação disponíveis na Weka, fazendo uma comparação entre elas para a base adotada. Para cada estratégia, façam variações dos parâmetros de entrada.
3.2 BASE DE DADOS
A base de dados escolhida foi a Zoo, disponível em http://repository.seasr.org/Datasets/UCI/csv/zoo. A base de 15 de Julho de 2008 armazena dados sobre características de animais de um zoológico, sendo composta por 17 atributos e 102 instâncias. A seguir estão as informações sobre os atributos e seus possíveis valores:
1. Class name: 102
2. Hair: 2 (true, false)
3.