artigo de mineração de dados
Eduardo Pires Fernandes - 15/0165234
Departamento de Ciência da Computação - CIC
Departamento de Engenharia de Produção - EPR
Universidade de Brasília - UnB
Brasília, Distrito Federal
Email: eduardofernandes@aluno.unb.br
Resumo—Este trabalho apresenta a definição de mineração de dados de acordo com os principais autores da área e faz uma análise técnica das principais metodologias existentes, que servem para explorar grandes quantidade de dados à procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados.
I. I NTRODUÇÃO
O armazenamento de dados nos dias de hoje se tornou algo simples, visto a existência no mercado de várias tecnologias de banco de dados. Em decorrência desse grande volume de dados armazenado, surgiu a necessidade, além de se retirar as informações previamente conhecidas, de descobrir novos importantes padrões de dados que tem por finalidade na utilização de estratégias de negócios, bases de conhecimento e pesquisas.
Atualmente existem diferentes metodologias para a descoberta de padrões de dados e neste artigo será realizado uma análise técnica e comparativa de três das principais metodologias existentes para esta finalidade, denominadas KDD,
SEMMA e CRISP-DM.
Para melhor compreensão, dividimos este artigo em seis seções e algumas subseções que tratarão o assunto mais profundamente: Introdução, Mineração de Dados, Metodologias
Comparadas (A Metodologia KDD, A Metodologia SEMMA e A Metodologia CRISP-DM), Um Estudo Comparativo, Análise Crítica e Conclusão, e Referências.
II. M INERAÇÃO DE DADOS
A definição sobre o termo Mineração de dados, por ser considerada multidisciplinar, varia com a área de atuação de cada autor. Neste artigo destacam-se três áreas de grande expressão dentro de Mineração de Dados: Banco de Dados, Aprendizado