estatistica
Análise Exploratória de Dados
A média aritmética e o desvio padrão são medidas muito utilizadas por duas razões: são de fácil compreensão apresentam boas propriedades algébricas e estatísticas na inferência estatística
Diagrama de ramo e folhas
Resumo de cinco números
Limitações:
Gráfico de caixa (Box Plot)
Essas medidas descrevem de forma ótima distribuições de frequências simétricas simétricas. Numa distribuição assimétrica seus valores são bastante afetados pelos valores discrepantes, ou seja, não são medidas resistentes.
1
1970 → John Tukey propôs técnicas que contornavam esses problemas que a média e o desvio padrão apresentavam quando eram utilizados para descrever distribuições assimétricas
O conjunto dessas técnicas recebeu a denominação de
Análise Exploratória de Dados.
2
Diagrama de ramo e folhas
Trata-se de uma ferramenta exploratória útil para descrever pequenos conjuntos de dados dados. O método fornece uma boa visão geral dos dados sem que haja perda de informação.
É um procedimento alternativo para resumir um conjunto de valores, com o objetivo de se obter uma ideia da forma de sua distribuição, semelhante a um histograma histograma. Principais técnicas exploratórias:
O gráfico de ramo e folhas é uma boa opção quando temos em mãos somente os dados, caneta e papel.
Diagrama de ramo e folhas
John Wilder Tukey
(1915 - 2000)
Resumo de cinco números
Gráfico de caixa (do inglês box plot)
3
4
1
Exemplo:
Passos para obtenção do diagrama
Consideremos os seguintes dados relativos às notas de 40 alunos em uma prova de Estatística.
1º Passo: ordenação dos dados.
78
59
86
94
43
56
78
84
57
49
96
68
67
65
75
73
67
87
84
45
56
94
87
56
85
76
86
79
78
77
59
76
68
49
86
87
83
94
85
96
43 45 49 56 56 56 57 59
59 65 67 67 68 68 73