Datamining
Disciplina de Data Mining
Docente: Ana Margarida Alexandre
EXERCÍCIO FINAL DE AVALIAÇÃO
- CLUSTER MODEL -
Trabalho elaborado por:
João Matos nº 20070093 Nuno Pinto nº 20070811
Turma: 3N1
Índice
Introdução 3
Criação do projecto 4
Tratamento de missings 5
Definição dos clusters 12
Cluster analysis 15
Segment Profile 18
Estratégia de marketing 19
Introdução
Com base nas aulas tidas no decorrer do semestre, vamos de seguida mostrar os vários passos que são necessários percorrer para no final se poder fazer uma análise e desenvolver uma estratégica de Marketing tendo em conta os resultados obtidos, que possa ser eficaz e melhorar a rentabilidade de uma empresa.
Criação do projecto
Começamos o nosso trabalho pela criação de um projecto e a primeira situação importante que merece destaque é a definição do Role e Level de cada variável.
A seguir examinámos os dados que nos foram fornecidos através da exploração de variáveis
Tratamento de missings
Para o tratamento, criamos o impute e modificamos o campo default input method para “Tree”
[pic]
Obtivemos os seguintes missings:
[pic]
O passo a seguir foi a transformação da variável “ano” em “idade” como indica a imagem em anexo.
De seguida, criámos o Metadata e agora já temos o campo idade após a modificação anteriormente feita.
Criámos 2 “transform variables” para verificar que tipo de amostra se usa com cada variável (Max Normal ou Log)
[pic]
Escolher o Max normal ou log da variável bebidas:
O primeiro é o Max e o segundo é o log. Escolhemos o log porque os valores são mais simétricos que o Max.
1º Max normal
2º Log
Max normal:
Log:
Carnespeixes - Escolhemos Max-normal porque o gráfico apresenta uma maior uma maior amplitude de valores que no LOG
Frutveg - Escolhemos