Análise Exploratória de Dados Damásio 2013
Análise Exploratória de Dados
Informações sobre os dados trabalhados
Utilizamos o conjunto de 33 observações ordenadas que seguem abaixo:
7,334
26,690
34,760
18,830
26,770
35,750
20,800
26,780
35,910
21,657
27,050
36,980
23,030
27,670
37,080
23,230
29,900
39,580
24,050
31,110
44,045
24,321
33,200
45,290
25,500
33,730
45,381
25,500
33,760
67,009
25,800
33,890
69,731
2
UERJ – Universidade do Estado do Rio de Janeiro
Análise Exploratória de Dados
Questão 1:
1. Faça um gráfico de caixa e identifique os "outliers".
Baseado na forma gráfica conhecida como Box-Plot, o gráfico abaixo nos permite visualizar o conjunto de dados, agrupados em cinco informações:
Valor mínimo = 7,334;
Primeiro Quartil = 25,500;
Mediana = 29,900;
Média = 32,185;
Terceiro Quartil = 35,910
Valor Máximo = 69,731.
Case Processing Summary
Cases
Valid
Missing
Total
N
VAR
Percent
N
Percent
N
Percent
33
100,0%
0
,0%
33
100,0%
3
UERJ – Universidade do Estado do Rio de Janeiro
Análise Exploratória de Dados
Questão 2:
2. Se houverem "outliers", retire-os da amostra e refaça o gráfico de caixa.
O gráfico a seguir, também possui a forma de um Box-Plot, entretanto, sem a presença de outliers, que podem ser identificados como os dados que apresentam um grande afastamento dos demais.
Case Processing Summary
Cases
Valid
Missing
Total
N
VAR
Percent
N
Percent
N
Percent
30
90,9%
3
9,1%
33
100,0%
4
UERJ – Universidade do Estado do Rio de Janeiro
Análise Exploratória de Dados
Questão 3:
3. Forneça as estatísticas descritivas básicas.
No quadro que segue, encontramos as principais estatísticas descritivas dos dados fornecidos, o que nos auxilia na descrição e avaliação das informações fornecidas.