Data Mining Gest O Do Conhecimento
Estudo sobre o artigo: Mineração de dados:
Aplicações. Eficiência e Usabilidade
Autores:
Michel Ferreira Bueno
Maury Reis Viana
Motivação
Grandes quantidades de dados de clientes
Falta de uma conexão direta entre esses
dados
Falta Informação !!!
Auxilio a tomada de decisões
Uma primeira abordagem sobre Data
Mining
A Quantidade de dados produzida entre 1986
e 2007 foi de 296 Exabytes.
Ou... 2.960 Petabytes,
Ou... 2.960.000 Terabytes
Ou... 2.960.000.000 Gigabytes
Uma primeira abordagem sobre Data
Mining
Até 04/2014: 44.000.000.000.000 Gigabytes
ou 44 Zettabytes.
Estimativa de 444 Trilhões de Gigabytes até
2020.
Quanto disto é útil ? O quanto disto pode ser transformado em Informação ?
Surge o Data Mining
O que é Data Mining ?
“É Extrair informações em grandes
quantidades de dados”
“É Substituir a busca manual por informações” Conceito KDD (Knowledge Discovery
Database) – Identificar padrões.
3 Conceitos que tornam o Data Mining possível: AI - Inteligência dos softwares
Database – Base de armazenamento de dados
Estatística – Estudo de dados
Como funciona o KDD
Dividido em 5 Processos:
Seleção – Escopo do Processamento
Pré-Processamento – Limpeza dos Dados
Transformação – Reorganização dos Dados
Mineração – Dados são transformados em
Informação
Análise – Interpretação da Informação Obtida
Conceitos do Data Mining
Dois conceitos importantes do Data Mining
Tarefa – É a especificação do que estamos procurando Técnica de Mineração - É a especificação do método
Técnicas Estatísticas
Técnicas de Aprendizado
Técnicas Baseadas em Crescimento Poda-Validação
Após a aplicação das Técnicas define-se a Análise a
ser utilizada
Análise de Amostragem
Análise Descritiva
Analise de Prognóstico
Tipos de Análises
Análises de Amostragem - Informações com
comportamentos que fogem do normal devem ser descartadas antes da mineração.
Análises Descritivas - Estabelecem relações e associações para descrever o modelo e