Apresenta O MINERA O DADOS
DE DADOS
TODOS OS DIAS MILHARES DE DADOS SÃO
ARMAZENADOS POR INSTITUIÇÕES, EMPRESAS,
PESSOAS ...
• Os satélites de observação da NASA geram cerca de um terabyte de dados por dia;
• O projeto Genoma armazena milhares de bytes para cada uma das bilhões de bases genéticas; • Instituições mantêm arquivos com milhares de transações dos seus clientes.
MAS POR QUE ARMAZENAR MILHARES DE
DADOS TODOS OS DIAS? O QUE PODEMOS
FAZER COM ELES???
?
MINERAÇÃO DE DADOS TRATA-SE
DA CIÊNCIA E ARTE DE EXPLORAR
GRANDES QUANTIDADES DE
DADOS A FIM DE DESCOBRIR
PADRÕES ÚTEIS.
ÁREAS DE APLICAÇÃO:
• RETENÇÃO DE CLIENTES: IDENTIFICAÇÃO DE PERFIS PARA DETERMINADOS
PRODUTOS, VENDA CRUZADA;
• BANCOS: IDENTIFICAR PADRÕES PARA AUXILIAR NO GERENCIAMENTO DE
RELACIONAMENTO COM O
• CLIENTE;
• CARTÃO DE CRÉDITO: IDENTIFICAR SEGMENTOS DE MERCADO, IDENTIFICAR
PADRÕES DE ROTATIVIDADE;
• COBRANÇA: DETECÇÃO DE FRAUDES;
• TELEMARKETING: ACESSO FACILITADO AOS DADOS DO CLIENTE;
• ELEITORAL: IDENTIFICAÇÃO DE UM PERFIL PARA POSSÍVEIS VOTANTES;
• MEDICINA: INDICAÇÃO DE DIAGNÓSTICOS MAIS PRECISOS;
• SEGURANÇA: NA DETECÇÃO DE ATIVIDADES TERRORISTAS E CRIMINAIS [48] [15];
• AUXÍLIO EM PESQUISAS BIOMÉTRICAS [38];
• RH: IDENTIFICAÇÃO DE COMPETÊNCIAS EM CURRÍCULOS [9];
FASES DA MINERAÇÃO DE DADOS
• 1. Entendimento dos Negócios: Nessa etapa, o foco é entender qual o objetivo que se deseja atingir com a mineração de dados. O entendimento do negócio irá ajudar nas próximas etapas.
FASES DA MINERAÇÃO DE DADOS
• 2. Entendimento dos Dados: As fontes fornecedoras dos dados podem vir de diversos locais e possuírem diversos formatos. Após definir os objetivos, é necessário conhecer os dados visando: Descrever de forma clara o problema; Identificar os dados relevantes para o problema em questão; Certificar-se de que as variáveis relevantes para o projeto não são interdependentes. FASES DA MINERAÇÃO DE DADOS
• 3. Preparação dos Dados: Devido às diversas origens possíveis, é comum que os dados não
estejam