Data Mining Ou Minera O De Dados Consiste Em Um Processo Anal Tico Projetado Para Explorar Grandes Quantidades De Dados

817 palavras 4 páginas
Data Mining ou Mineração de Dados consiste em um processo analítico projetado para explorar grandes quantidades de dados (tipicamente relacionados a negócios, mercado ou pesquisas científicas), na busca de padrões consistentes e/ou relacionamentos sistemáticos entre variáveis e, então, validá-los aplicando os padrões detectados a novos subconjuntos de dados.
O processo consiste basicamente em 3 etapas: exploração; construção de modelo ou definição do padrão; e validação/verificação e no mesmo uilizam diversos algoritmos computacionais tais como Segmentação, Classificação e Previsão.
A literatura sobre o assunto trata com mais detalhes todos os passos necessários ao Data Mining. Veja, por exemplo, Groth (1998) e Han, Chen & Yu (1996). Para o escopo do que pretendemos neste artigo é suficiente apresentar os passos fundamentais de uma mineração bem sucedida. A partir de fontes de dados (bancos de dados, relatórios, logs de acesso, transações, etc) efetua-se uma limpeza (consistência, preenchimento de informações, remoção de ruído e redundâncias, etc). Disto nascem os repositórios organizados (Data Marts e Data Warehouses), que já são úteis de diversas maneiras.
Mas é a partir deles que se pode selecionar algumas colunas para atravessarem o processo de mineração. Tipicamente, este processo não é o final da história: de forma interativa/iterativa e frequentemente usando visualização gráfica, um analista refina e conduz o processo até que padrões apareçam.
Observe que todo esse processo parece indicar uma hierarquia, algo que começa em instâncias elementares (embora volumosas) e terminam em um ponto relativamente concentrado, mas muito valioso. Este é um dos conceitos importantes neste artigo: encontrar padrões requer que os dados brutos sejam sistematicamente “simplificados” de forma a desconsiderar aquilo que é específico e privilegiar aquilo que é genérico. Faz-se isso porque não parece haver muito conhecimento a extrair de eventos isolados.
Uma loja de sua rede que

Relacionados

  • Sistemas robustos de rede
    21105 palavras | 85 páginas
  • Inteligência artificial
    173775 palavras | 696 páginas