Conceito de Minera o de Dados
Como obter informações úteis de dados brutos de um Estudo de Caso
Katiély Rohden da Silva1
(Acadêmica do curso de Sistemas de Informação – UNIBAVE)
Roberto Rohden Filho2
(Acadêmico do curso de Sistemas de Informação – UNIBAVE)
RESUMO: O avanço das tecnologias de informação e o armazenamento de dados proporcionam novas possibilidades para o uso de dados na tomada de decisão. A Mineração de Dados é uma dessas possibilidades, ela consiste no uso de técnicas automatizadas de exploração de grandes quantias de dados com o intuito de relacioná-los e classificá-los a fim de descobrir novos padrões. A partir desses padrões, propor as estratégias de negócio voltadas a aumentar a competitividade. A Mineração de Dados é uma das de etapas de um processo maior, chamado KDD. O KDD é um processo constituído por 4 etapas principais: seleção de dados, pré-processamento, transformação e mineração de dados que serão responsáveis respectivamente por selecionar de dados com potencial de padrão; limpar os dados a fim de corrigir inconsistências; normalizar os dados a fim de torná-los válidos e implementar algoritmos para interpretação desses dados. Algoritmo é um conjunto de heurísticas e cálculos que cria um modelo de mineração de dados. Esse modelo pode assumir vários formatos: conjunto de clusters, que são conjuntos de dados relacionados; árvores de decisão que preveem um resultado e descrevem como os critérios o afetam; modelos matemáticos que preveem as vendas; conjuntos de regras que são probabilidades de que produtos são comprados juntos. Dependendo do seu objetivo deve-se optar por um ou outro algoritmo de mineração de dados: classificação, regressão, segmentação ou análise de sequencia. A mineração de dados pode ser aplicada em diversas áreas que investem na administração de dados, seja para conhecer melhor seus clientes, seja para ter uma previsão de vendas ou mesmo avaliar as tendências de mercado. Utilizando uma base fictícia iremos mostrar um