mineração
A mineração de dados pode ser considerada como uma parte do processo de
Descoberta de Conhecimento em Banco de Dados (KDD – Knowledge Discovery in
Databases).
Segundo Goebel e Gruenwald (1999), o termo KDD é usado para representar o processo de tornar dados de baixo nível em conhecimento de alto nível, enquanto mineração de dados pode ser definida como a extração de padrões ou modelos de dados observados. A mineração de dados combina métodos e ferramentas das seguintes áreas: aprendizagem de máquina, estatística, banco de dados, sistemas especialistas e visualização de dados, conforme Figura 2.1 (Cratochvil, 1999).
Aprendizagem de Máquina
Sistemas
Especialistas
KDD
Estatística
Banco de
Dados
Visualização
Figura 2.1: A Mineração de Dados como um Campo Multidisciplinar
2.2.1 Conceito de Mineração de dados
“Mineração de dados é a exploração e a análise, por meio automático ou semiautomático, de grandes quantidades de dados, a fim de descobrir padrões e regras significativos” (Berry e Linoff, 1997, p.5).
Os principais objetivos da mineração de dados são descobrir relacionamentos entre dados e fornecer subsídios para que possa ser feita uma previsão de tendências futuras baseada no passado.
Fundamentação Teórica
2
Os resultados obtidos com a mineração de dados podem ser usados no gerenciamento de informação, processamento de pedidos de informação, tomada de decisão, controle de processo e muitas outras aplicações.
A mineração de dados pode ser aplicada de duas formas: como um processo de verificação e como um processo de descoberta (Groth, 1998). No processo de verificação, o usuário sugere uma hipótese acerca da relação entre os dados e tenta prová- la aplicando técnicas como análises estatística e multidimensional sobre um banco de dados contendo informações passadas. No processo de descoberta não é feita nenhuma suposição antecipada. Esse processo usa técnicas, tais como descoberta de