Escrita
Mineração de dados ou data mining é o processo de explorar grandes quantidades de dados à procura de padrões consistentes, como regras de associação ou seqüências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados.
Esse é um tópico recente em Ciência da computação, mas utiliza várias técnicas da Estatística, Recuperação da Informação, Inteligência Artificial e reconhecimento de padrões.
Visão geral
Esta tecnologia é formada por um conjunto de ferramentas que através do uso de algoritmos de aprendizado ou baseados em redes neurais e estatística, são capazes de explorar um grande conjunto de dados, extraindo dos mesmos conhecimento, na forma de hipóteses e de regras. Diariamente as empresas acumulam diversos dados em seus bancos de dados, inclusive com dados e hábitos de seus clientes. Todos estes dados podem contribuir para a empresa, sugerindo tendências e particularidades pertinentes a ela e seu meio ambiente interno e externo, visando uma rápida ação de seus gestores.
Com a geração de informações e conhecimentos úteis para as empresas, os seus negócios geram mais lucratividade. Os recursos da Tecnologia da Informação, mais precisamente a capacidade do hardware e software disponíveis podem concluir atividades em questão de horas, o que tradicionalmente as pessoas levariam meses. Efetivamente a mineração de dados cumpre o papel de descoberta de conhecimentos.
Etapas da Mineração de Dados
Os passos fundamentais de uma mineração bem sucedida a partir de fontes de dados (bancos de dados, relatórios, logs de acesso, transações, etc), é a realização de uma limpeza (consistência, preenchimento de informações, remoção de ruído e redundâncias, etc). Disto nascem os repositórios organizados (Data Marts e Data Warehouses).
É a partir deles que se pode selecionar algumas colunas para atravessarem o processo de mineração. Tipicamente, este processo não é o final da história: de forma