Mineração de dados
PROCESSO DE DESCOBERTA DE CONHECIMENTO EM BANCOS DE DADOS (KDD)
09 out. 2012
Aula 23
Introdução
2
Segundo Han e Kamber (2006 ) a principal razão pela qual a mineração de dados tem atraído muita atenção na indústria da informação nos últimos anos é devido a dois fatores:
grande
disponibilidade de enormes quantidades de
dados; necessidade iminente para transformar esses dados em informações e conhecimentos úteis.
Introdução
3
Crescimento explosivo das bases de dados
Governo,
corporações, institutos científicos Dados de tarefas cotidianas são armazenados em BDs Alcance da Internet – gigantesco tráfego e volume de dados
Demanda por informações estratégicas
Meios
convencionais para examinar dados Eminente necessidade de novas técnicas/ferramentas Análise automática e inteligente de grandes BDs Grande número de aplicações
Introdução
4
Motivações
Grande disponibilidade de dados armazenados eletronicamente Existem informações úteis, invisíveis, nesses grandes volumes de dados Aproveitar para prever um conhecimento futuro (ir além do armazenamento explícito de dados).
[01] Queens University - Belfast
Cenário
5
Hoje, a maioria das organizações produz mais informações em uma semana do que muitas pessoas poderiam ler em toda vida.
“MAIS DADOS PODE SIGNIFICAR MENOS INFORMAÇÕES”
Cenário
6
Grande concentração de dados armazenados; Dificuldade para analisar estes dados por métodos manuais tradicionais:
Planilhas
de dados, relatórios operacionais, onde o especialista testa sua hipótese contra a base de dados;
A informação não está explicitada Necessidade
técnicas
que facilitem a extração e conhecimento implícito para uso no âmbito do
informações
problema
o
dado operacional não oferece grande valor quando estudado