DataMining
1
Tópicos da Apresentação
Introdução
Background
Funções
Processo
Uma arquitetura
Técnicas
Exemplos
Referências
2
Introdução
• Motivações
– Grande disponibilidade de dados armazenados eletronicamente – Existem informações úteis, invisíveis, nesses grandes volumes de dados – Aproveitar para prever um conhecimento futuro (ir além do armazenamento explícito de dados).
[01] Queens University - Belfast
3
Introdução
• O que é Data mining:
– “Data mining (mineração de dados), é o processo de extração de conhecimento de grandes bases de dados, convencionais ou não.
– Utiliza técnicas de inteligência artificial que procuram relações de similaridade ou discordância entre dados.
– Seu objetivo é encontrar, automaticamente, padrões, anomalias e regras com o propósito de transformar dados, aparentemente ocultos, em informações úteis para a tomada de decisão e/ou avaliação de resultados.
Fernando S. Goulart Júnior & Robson do Nascimento Fidalgo (1998)
4
Introdução
• Exemplo:
Fabricante Estado Cidade Cor do Produto Lucro
Smith
CA
Los Angeles
Azul
Alto
Smith
AZ
Flagstaff
Verde
Baixo
Adams
NY
NYC
Azul
Alto
Adams
AZ
Flagstaff
Vermelho
Baixo
Johnson
NY
NYC
Verde
Médio
Johnson
CA
Los Angeles
Vermelho
Médio
•Conclusões:
•Produtos azuis são de alto lucro ou •Arizona é um lucro baixo
5
Introdução
• Uma empresa utilizando mining é capaz de:
data
– Criar parâmetros para entender o comportamento do consumidor;
– Identificar
afinidades
entre
as
escolhas de produtos e serviços;
– Prever hábitos de compras;
– Analisar
comportamentos
habituais
para detectar fraudes.
[09] - Dissertação - UERJ (1997)
6
Introdução
• Data mining X Data warehouse:
– Data mining extração inteligente de dados;
– Data warehouse repositório centralizado de dados;
– Data mining não é uma evolução do Data warehouse;
– Data mining não depende do Data warehouse, mas obtém-se melhores resultados quando aplicados em conjunto; – Cada empresa deve saber escolher qual