Mineração de dados
RAFAEL NUNES DE SOUSA
Mineração de Dados
Tubarão
2011
Sumário 1.Introdução 5 2. Fases do KDD 6 2.1Seleção 6 2.2 Pré-processamento 6 2.3 Transformação 7 2.4 Data mining 7 2.5 Interpretação e Avaliação 7 3.Descrição da Base de Dados 8 4.Regras Weka 9 5.Conclusão 11 6.Referencias 12
1.Introdução
As empresas nos dias de hoje tem um grande problema com o armazenamento de dados. E o que antes se acreditava ser informações inúteis hoje é uma grande forma de conhecer o seu mercado, clientes entre outros.
Neste contexto está situado o KDD (Knowledge Discovery in Databases) [FAYY96], que busca extrair de grandes bases de dados as informações que não podem ser encontradas a olho nu. Inserido neste processo de descoberta, temos uma etapa que denominamos Datamining (Mineração) onde são aplicadas as técnicas para buscar as informações.
2. Fases do KDD
O Significado de KDD é “Knowledge Discovery in Database”, e isso refere-se a um trabalho de extração de informações de uma determinada base de dados. Esta extração pode resultar em algumas regras ou associação de dados que possam ser usadas em uma tomada de decisão ou também em uma forma de analisar o comportamento de em algumas situações corriqueiras como a simples tarefa de ir ao mercado e comprar alguma coisa. Essa técnica foi criada pois o volume de informações estava aumentando muito e o trabalho de analise de tais situação levava muito tempo. A automatização então foi uma forma de facilitar o trabalho e deixa lo mais rápido.
Esse tipo de extração segue etapas, cada etapa gera um conjunto de conhecimentos , de informação de difícil detecção em métodos mais lentos ou tradicionais de leitura e análise. Refere-se às informações de grande valor para uma tomada de decisão. Esse tipo de extração permite que as organizações consigam detectar informações mais profundas que estão escondidas no banco de dados.
O KDD é uma extração de descoberta de