Mineração de dados
Prof. Daniel Corrêa da Silva
OBJETIVOS
Introdução a
Mineração de
Dados
Conceituar Mineração de dados
Apresentar áreas de Aplicação
Descrever as tarefas de mineração de dados
Introdução a Mineração de Dados
MINERAÇÃO DE DADOS
Mineração de Dados: é o processo de exploração e descoberta de informações úteis em grandes depósitos de dados utilizando a combinação de métodos tradicionais de análise com algoritmos sofisticados. Áreas de Aplicações:
Negócio
Medicina
Ciências Biológicas
Engenharia
Introdução a Mineração de Dados
MINERAÇÃO DE DADOS
Mineração de Dados e descoberta de conhecimento: é o processo de conversão de dados brutos em informações
•Padrões de Filtragem
•Seleção de recursos úteis. •Redução de Dimensionalidade
•Visualização
•Interpretação de Padrões
•Normalização
•Criação de Subconjunto de dados
Préprocessamento de Dados
DADOS BRUTOS
Mineração de
Dados
Pósprocessamento
INFORMAÇÃO
Introdução a Mineração de Dados
MINERAÇÃO DE DADOS
• Pré-processamento: tem o objetivo de transformar os dados brutos em um formato apropriado para análise subseqüente. Exemplos: fusão de dados de múltiplas fontes de dados, retirada de ruídos, remoção de dados duplicados, seleção de dados relevantes.
• Mineração de dados: processo de exploração e descoberta automática de informações úteis em grandes bases de dados.
• Pós-processamento: assegura que apenas resultados válidos e úteis sejam incorporados ao sistema de apoio a decisão. Exemplos: visualização, medições estatísticas e análise de dados multidimensionais. Introdução a Mineração de Dados
DESAFIOS MOTIVADORES
• Escalabilidade: tratar grandes quantidades de dados: gigabytes, terabytes e pentabytes utilizando algoritmos de busca exponenciais.
• Alta dimensionalidade: tratar conjunto de dados com centenas ou milhares de atributos.
• Dados complexos e Heterogêneos: tratar com atributos
heterogêneos