Data mining tipo 1
Definição
Data mining (ou mineração de dados) é o processo de extrair informação válida, previamente desconhecida e de máxima abrangência a partir de grandes bases de dados, usando-as para efetuar decisões cruciais.
Data mining vai muito além da simples consulta a um banco de dados, no sentido de que permite aos usuários explorar e inferir informação útil a partir dos dados, descobrindo relacionamentos escondidos no banco de dados. Pode ser considerada uma forma de descobrimento de conhecimento em bancos de dados (KDD - Knowledge Discovery in Databases), área de pesquisa de bastante evidência no momento, envolvendo Inteligência Artificial e Banco de Dados.
Processo
Data Mining ou Mineração de Dados consiste em um processo analítico projetado para explorar grandes quantidades de dados (tipicamente relacionados a negócios, mercado ou pesquisas científicas), na busca de padrões consistentes e/ou relacionamentos sistemáticos entre variáveis e, então, validá-los aplicando os padrões detectados a novos subconjuntos de dados.
Técnicas distintas como redes neurais, indução de árvores de decisão, sistemas baseados em regras e programas estatísticos, tanto isoladamente quanto em combinação, podem ser aplicadas ao problema. Em geral, o processo de busca é interativo, de forma que os analistas revêem o resultado, formando um novo conjunto de questões para refinar a busca em um determinado aspecto das descobertas e, realimentam o sistema com novos parâmetros. Ao final do processo, o sistema de data mining gera um relatório das descobertas, que passa então a ser interpretado pelos analistas de mineração. De posse da interpretação das informações, torna-se possível a obtenção de algum tipo de conhecimento.
Etapas
As operações necessárias para se efetuar uma análise por Data Mining pode ser dividida em 4 fases: Análise do Problema, Preparação dos dados, Modelagem e, Análise e Validação dos Resultados.
a) Análise do problema: o processo de análise deve