Data Minning
AData Minning aguda João Costa
Lucas Morati
Priscila Correa
Jonas Pinto
Índice
TOC \o "1-3" \h \z \u 1Introdução32Objectivos43Materiais e Métodos43.1Base de Dados43.2Ferramentas utilizadas53.3Tratamento dos Dados53.4Factores de Exclusão64Resultados e Discussão64.1Análise Inicial64.2Resultados da Análise Inicial74.3Discretização das Variáveis Contínuas84.4Agrupamento de variáveis94.5Exclusão das Variáveis Redundantes ou Inferidas104.6Seleção de Dados104.7Nova Base de Dados104.8Análise Inicial da distribuição dos dados114.9Dificuldades Encontradas184.10Durante o processo de análise surgiram as seguintes questões195Conclusão206Referências bibliográficas22
Introdução
Sistemas de Apoio à Decisão podem ser descritos como sistemas de informação interactivos, flexíveis e adaptáveis, especialmente desenvolvidos para apoiar a solução de um problema de gestão não estruturado para aperfeiçoar a tomada de decisão. Utilizam dados, fornecem uma interface amigável e permitem ao utilizador ter a sua própria percepção das decisões [1]. O Data Mining é um processo analítico utilizado para explorar dados, normalmente em grandes quantidades, procurando padrões consistentes e/ou relações sistemáticas entre variáveis [2]. Nos métodos de Data Mining podemos destacar as Árvores de Decisão/Regressão, a Indução de Regras, as Redes Neuronais Artificiais, as Máquinas de Vectores de Suporte entre outros.
A Descoberta de Conhecimento em Bases de Dados, tradução do inglês Knowledge Discovery in Databases, tem como objectivo desenvolver métodos e técnicas de extracção de conhecimento de alto nível a partir de informação guardada em bases de dados. Pode ser definida como o processo que permite identificar padrões e/ou modelos que sejam novidade, potencialmente úteis e compreensíveis. É um processo interactivo e iterativo, no qual se podem distinguir as seguintes etapas [3]: