Weka
Flávio Miguel Varejão
Missael de Nadai
Raphael Broetto
Jornadas de Atualização em Computação,
Elétrica e Eletrônica
Setembro - 2012
Conteúdo
Introdução
Weka
Pré-processamento
Visualização
Classificação
Seleção de atributos
Agrupamento
JACEE 2012
2
Introdução
Tomada de Decisões
JACEE 2012
4
Motivação
Leis
Lei de Moore: Capacidade de processamento dobra a cada 18 meses
(CPU, memória, cache)
Capacidade de armazenamento dobra a cada 10 meses
O que estas duas “leis” combinadas produzem? Um gap crescente entre nossa habilidade de gerar dados e nossa habilidade de fazer uso dele
JACEE 2012
6
Problema
Crescimento da Base da Pirâmide
Capacidade Reduzida de Análise
JACEE 2012
7
Problema
Com a evolução da computação, atualmente uma aplicação pode gerar terabytes de dados em poucas horas
Mas...
Os potenciais usuários não são capazes de analisar tamanha quantidade de dados em tempo hábil
JACEE 2012
8
Conclusão
Estamos sedentos por conhecimento, mas nos afogando em dados! JACEE 2012
9
Conclusão
É necessário o desenvolvimento de tecnologias de extração automática de conhecimento de bases de dados
JACEE 2012
10
Mineração de Dados
Também conhecido como Descoberta de
Conhecimento em Bases de Dados
KDD: “Knowledge Discovery in Databases”
Surge a partir da área de Aprendizado de
Máquina em Inteligência Computacional
Algoritmos capazes de aprender relações entre dados a partir de um conjunto de exemplos
JACEE 2012
11
Fundamentos
Objetivos
Encontrar conhecimento a partir de um conjunto de dados para ser utilizado em um processo decisório
Ideal que o conhecimento descoberto seja compreensível a humanos, além de útil e interessante para os usuários finais
JACEE 2012
13
Definição
“Extração de conhecimento de bases de dados é o processo de