Com base no artigo “Mineração de Dados” Conceitos, aplicações e experimentos com WEKA”
Responda:
1- Defina KDD e suas fases.
O processo KDD desponta como um conjunto de técnicas e ferramentas capazes decontribuir amplamente para o problema de Aquisição de Conhecimento implícito emgrandes volumes de dados. Definição do problema; Seleção dos dados; Limpeza dos dados; Pré-processamento dos dados; Codificação dos dados; Enriquecimento dos dados; Mineração dos dados (Data Mining) e a Interpretação dos resultados.
2- Explique com suas palavras o que é um padrão válido, novo, potencialmente útil e compreensível.
Padrão: É um subconjunto usado como termo de comparação em uma tomada dedecisão.
Válida: Uma vez descobertos os padrões existentes em um banco dedados, eles serão válidos para os novos dados com um determinado grau de certeza.
Novo: Uma vez que a novidade pode ser medida com relação às mudanças nos dados ou no conhecimento, pode-se considerar que os padrões são caracteristicamente recentes. Essa mudança é estabelecida pela comparação dos valores atuais com os anteriores ou com os valores esperados, enquanto o conhecimento é uma nova descoberta relacionada ao conhecimento anterior.
Potencialmente útil: Os padrões podem ser potencialmente guiados por algumasações úteis, como medidas de alguma função utilitária.
Compreensível: Onde é fácil de ser entendido. 3- Explique o que pode ser feito na fase de pré-processamento dos dados.
Etapa de pré-processamento que compreende as funções que se relacionam acaptação, à organização e ao tratamento de dados, cujo objetivo é preparar os dados para os algoritmos da etapa seguinte; etapa de Data Mining (Mineração de Dados) que realiza a busca efetiva de conhecimentos úteis no contexto proposto para a aplicação do KDD.
4- O que é Mineração de Dados?
Mineração de dados ou data mining é o processo de explorar grandes quantidades dedadas à procura de padrões consistentes, como regras de associação ou