loucura
Antônio Fonseca
Gleyberson Andrade
João Carlos
Juliano Tabanês
Leomir Moura
Departamento de Ciência da Computação
MINERAÇÃO DE DADOS
Introdução a Sistemas de Informação
Fernanda Sumika
São João del Rei – MG
2013 / 2º semestre
Introdução
Neste trabalho, trataremos de um assunto bastante importante relacionado à área de TI, a mineração de dados.
Com o grande aumento da utilização dos sistemas computacionais, um grande volume de dados está sendo criado de forma confusa. Devido a esse fator, fica difícil saber o que são e a que estão vinculados esses dados. Para separar e organizá-los, entra em cena a mineração de dados, assunto pelo qual trataremos a seguir.
Mineração de dados
Mineração de dados é uma análise projetada que, através do uso de algoritmos de aprendizagem ou classificação baseada em redes neurais, vasculha uma grande quantidade de dados visando criar novos subconjuntos e assim padronizá-los, auxiliando na descoberta de conhecimento.
O processo de busca de conhecimento em banco de dados, mais conhecido como KDD, contém uma série de passos: seleção, pré-processamento e limpeza, transformação, mineração de dados e interpretação/avaliação.
Seleção: É a primeira fase no processo de descobrimento de informação. É bastante complexa, uma vez que os dados podem vir de uma série de fontes diferentes e podem possuir os mais diversos formatos. Possui impacto significativo sobre a qualidade do resultado final, uma vez que nesta fase é escolhido o conjunto de dados contendo todas as possíveis variáveis e registros que farão parte da análise. Normalmente essa escolha dos dados fica a critério de um especialista do domínio.
Preprocessamento e limpeza: No processo KDD é uma parte muito importante, pois é ela que vai determinar a eficiência dos algoritmos de mineração. Pois ela elimina os dados redundantes e inconsistentes. Também recuperam dados incompletos e avaliam possíveis