Logica
1
Box Plot
O box plot (gráfico de caixa) é uma ferramenta exploratória de análise de dados;
O propósito deste gráfico é dar ao analista um método eficiente de examinar um conjunto de dados, para se ter uma primeira idéia da distribuição desses dados
2
Utilização
O box plot é especialmente útil quando trabalhamos com conjuntos limitados de dados para os quais outras ferramentas como histogramas, que requerem dados com 50 – 200 pontos onde o estudo pode ficar inválido ou insuficiente para se ter uma conclusão.
3
Através da disposição dos valores em ordem crescente tem-se uma idéia clara sobre a localização e a dispersão dos dados. Para o gráfico box plot precisamos calcular: Limite da haste inferior;
Limite da haste superior;
Primeiro quartil;
Terceiro quartil;
Mediana.
Estas 5 medidas são denominadas de estatística de ordem.
4
5
As informações dadas pelo resumo destes cinco números são apresentadas na forma de um gráfico de caixa que agrega uma série de informações sobre a distribuição
Posição; Dispersão; Assimetria;
Caudas;
Dados discrepantes.
*outliers
6
7
A posição central dos valores é dada pela mediana e a dispersão pela amplitude interquartílica.
As posições relativas da mediana e dos quartis e o formato dos bigodes dão uma noção da simetria e do tamanho das caudas da distribuição.
8
Interpretação de Box Plot
Quando a distribuição dos dados é simétrica, a linha que representa a mediana estará localizada mais ou menos no centro do retângulo e as duas linhas que partem das extremidades do retângulo terão aproximadamente os mesmos comprimentos;
Quando a distribuição dos dados é assimétrica à direita, a linha que representa a mediana estará mais próxima de Q1 do que de Q3; Quando a distribuição dos dados é assimétrica à esquerda, a linha que representa a mediana estará mais próxima de Q3 do que de Q1.
9
Exemplos
10
Exemplo
11
O box plot