Analise Exploratoria de dados
Instituto de Matemática e Estatística - IME
Trabalho de Análise Exploratória de Dados
Professor: Jorge Machado Damázio
JANEIRO/2015
Introdução
A fim de aplicar os conhecimentos adquiridos pela disciplina Análise Exploratória de Dados, realizamos este trabalho. Para a realização das tarefas utilizamos o Excel como ferramenta para cálculos e elaboração de gráficos.
Neste relatório utilizaremos de alguns artifícios para identificar outliers. O boxplot, ou diagrama de caixa, é um gráfico que capta importantes aspectos de um conjunto de dados através dos seguintes valores: limite inferior, primeiro quartil, segundo quartil, terceiro quartil e limite superior.
Transformação de dados é uma das possíveis formas de contornar o problema de dados que não obedecem os pressupostos da análise de variância e nesse trabalho utilizamos a transformação BOX-COX.
Desenvolvimento
Seja o conjunto de 33 observações ordenadas a seguir:
1
7,334
2
18,830
3
20,800
4
21,657
5
23,030
6
23,230
7
24,050
8
24,321
9
25,500
10
25,520
11
25,800
12
26,690
13
26,770
14
26,780
15
27,050
16
27,670
17
29,900
18
30,110
19
33,200
20
33,360
21
33,730
22
33,890
23
34,760
24
35,910
25
36,980
26
37,080
27
37,750
28
39,580
29
44,045
30
45,290
31
45,381
32
67,009
33
69,331
Faça um gráfico de caixa e identifique outliers se houver.
Usamos o Excel para fazer o gráfico Box Plot a fim de identificar possíveis outliers.
Para executar esta ação precisamos de informações que foram extraídas a partir das respectivas fórmulas também no Excel:
Medida
Fórmulas
Resultado
Quartis 1 e 3
=Quartil ( )
25,5 e 35,91
Mediana
=Med( )
29,9
Intervalo Interquartílico
= Quartil 3 – Quartil 1)
10,41
Limite Inferior
=Quartil 1 – 1,5 * Intervalo Interquartílico)
9,885
Limite Superior
=Quartil 3 + 1,5 *