Kdd - realizar a pesquisa bibliográfica sobre sistemas de informação
Brasília, 17 de Maio de 2012
1 KDD O termo KDD - Knowledge Discovery in Databases, foi formalizado em 1989 em referência ao amplo conceito de procurar conhecimento a partir de base de dados. Segundo Fayyad (1996) “KDD é um processo, de várias etapas, não trivial, interativo e iterativo, para identificação de padrões compreensíveis, válidos, novos e
potencialmente úteis a partir de grandes conjuntos de dados”. Segundo Goldschimidt & Passos (2005) o termo iterativo sugere a possibilidade de repetições integrais ou parciais do processo de KDD e a expressão não trivial alerta para a complexidade normalmente presente na execução de processos de KDD. Já com relação a expressão padrão válido indica que o conhecimento deve ser verdadeiro e adequado ao contexto da aplicação de KDD e o termo padrão novo deve acrescentar novos conhecimentos aos existentes, para que todo esse processo gere conhecimento útil que pode ser aplicado de forma a proporcionar benefícios ao contexto de aplicação de KDD. Porém, a extração de conhecimento de uma grande base de dados através da aplicação de um processo de KDD exige a melhor compreensão das diferenças entre dado, informação e conhecimento.
Figura 1: Hierarquia entre Dado, Informação e Conhecimento
Os dados, na base da pirâmide, podem ser interpretados como itens elementares, captados e armazenados por recursos da Tecnologia da informação Para definição dos objetivos em um processo de KDD requer, primeiramente, um entendimento claro da situação vigente no ambiente onde será realizado o processo. A etapa de definição de objetivos requer uma forte interação entre o analista de KDD e os especialistas do domínio da aplicação. ● ● ● ● Identificar pessoas e áreas envolvidas com a aplicação de KDD; Levantar o hardware e software existente; Inventar bases de dados disponíveis; Analisar bases de dados, procurando compreender o significado e a relevância dos atributos,