Data mining
Mineração de dados, ou Data Mining, é o processo de análise de conjuntos de dados que tem por objetivo a descoberta de padrões interessantes e que possam representar informações úteis. Um padrão pode ser definido como sendo uma afirmação sobre uma distribuição probabilística. Estes padrões podem ser expressos principalmente na forma de regras, fórmulas, funções, entre outras.
O interesse por este tipo de informação se deve principalmente ao fato de que as empresas e organizações estão coletando e armazenando grandes quantidades de dados como conseqüência da queda dos preços de meios de armazenamento e computadores e do aumento da capacidade de ambos. A popularização na utilização dos Data Warehousing, que são grandes bancos de dados criados para análise e suporte à decisão, tende a aumentar ainda mais a quantidade de informações disponível. Os métodos tradicionais de análise de dados, como planilhas e consultas, não são apropriados para tais volumes de dados, pois podem criar relatórios informativos sobre os dados, mas não conseguem analisar o conteúdo destes relatórios a fim de obter conhecimentos importantes.
2. Data Mining Com a geração de um volume cada vez maior de informação, é essencial tentar aproveitar o máximo possível desse investimento. Grandes corporações possuem seus sistemas de gestão, esses, armazenam em seus bancos de dados os acontecimentos do dia-a-dia: estoques, pedidos, compras, orçamentos, contábil, financeiro, jurídico, pós-venda, relacionamento com cliente, vendas entre outros. Talvez a forma mais prática de se utilizar desses repositórios seja tentar descobrir se há algum conhecimento escondido neles. O processo de Data Mining, ocorre por diversos algoritmos, que processa os dados e retira deles outros dados válidos, novos e valiosos. É importante ressaltar que embora os algoritmos sejam capazes de descobrir dados validos e novos, ainda precisamos de uma interação forte