Data mining
Sistemas de Informação
Tema: Mineração de Dados (Data Mining)
INTRODUÇÃO
Na medida em que crescem a quantidade de dados recebidos a serem analisados e armazenados por pequenas, médias e grandes empresas e o alto nível de competitividade do mercado, inclusive das pequenas e micro empresas, crescem também a preocupação, o estudo e a aplicação de técnicas de mineração destes dados na busca de conhecimentos que possam ser de grande valor para esse grupo de empresas. Nas últimas décadas essa tendência ficou ainda mais evidente com a queda nos custos para a aquisição de hardware, tornando possível armazenar quantidades cada vez maiores de dados. Novas e mais complexas estruturas de armazenamento foram desenvolvidas, tais como: banco de dados, data warehouses, Bibliotecas Virtuais e outras. Com o volume de dados armazenados crescendo diariamente, uma questão de extrema importância é: O que fazer com os dados armazenados? Com a finalidade de responder a esta questão, foi proposta, no final da década de 80, a Mineração de Dados, do inglês Data Mining.
ETAPAS
Hoje em dia, muitos processos definem e padronizam as etapas e as atividades da Mineração de Dados. Apesar das diferenças, todos têm estruturas parecidas. Atualmente o CRISP-DM (Cross-Industry Standard Processo of Data Mining) é considerado o padrão de maior aceitação. O processo CRISP-DM contém seis etapas organizadas em um ciclo. Porém, apesar de ser formado por etapas, o fluxo é bidirecional, podendo ir e voltar entre as etapas. As fases do processo CRISP-DM são:
1. Entendimento dos Negócios: Essa etapa tem como objetivo entender o que se deseja atingir com a mineração de dados. O entendimento do negócio é fundamental para as próximas etapas.
2. Entendimento dos Dados: Após definir oque se deseja, é necessário conhecer os dados visando descrever de forma clara o problema, identificar os dados relevantes para o problema em questão e certificar-se de que as variáveis relevantes para o projeto