Gestão de Sistemas de Conhecimento
Rodrigo Sucupira A. Lima
KDD - Knowledge Discovering in
Databases
"the non-trivial extraction of implicit, unknown, and potentially useful information from data''
"O processo não-trivial de extração de informação implícita, nova e potencialmente útil e compreensível de dados existentes" Frawley, W.J., Piatetsky-Shapiro, G., and Matheus, C. Knowledge Discovery In
Knowledge Discovery In Databases , eds.
G. Piatetsky-Shapiro, and W. J. Frawley, AAAI Press/MIT
Press, Cambridge, MA., 1991, pp. 1-30.
Databases: An Overview. In
KDD - Knowledge Discovering in
Databases
KDD - Knowledge Discovering in
Databases
- surgiu depois do conceito de Banco de
Dados.
- é um processo.
- não é um software.
KDD - Knowledge Discovering in
Databases
Elementos Essenciais de KDD
Todas as soluções lidam com um grande numero de dados.
É nescessária efíciencia frente ao volume de dados.
A acurácia é um elemento essencial.
Todos requerem uso de linguagens de alto-nível.
Todos utilizam alguma forma de aprendizado automático.
Todos produzem algum resultado interessante.
KDD - Knowledge Discovering in
Databases
Interpretação
Conhecimento
Data Mining
Transformação
Padrões
Preprocessamento
Dados
Transformados
(Indicadores)
Seleção
Dados
Preprocessados
Dados
Selecionados
Banco de Dados
KDD - Knowledge Discovering in
Databases
Exemplos de Operações de Pré-Processamento:
Seleção dos dados
Limpeza
KDD - Knowledge Discovering in
Databases
Limpeza dos dados
Verificação de consistência entre informações
Correção de erros
Preenchimento de valores desconhecidos
Eliminação de informações redundantes
Eliminação de valores não pertencentes ao domínio
KDD - Knowledge Discovering in
Databases
Exemplos de Operações de Pós-Processamento:
Construção de Árvores de Decisão
Elaboração de Relatórios
Elaboração de Gráficos
Construção de Árvores filogenéticas
Data Mining
Mineração de Dados,