O poderoso chefão
Formato do Blox-plot:
Assimétrico para a Direita: A maior parte dos valores está na parcela inferior da distribuição. Uma longa cauda e uma distorção para a direita são causadas por alguns valores extremante grandes. Os valores grandes puxam a média aritmética para cima: média > mediana.
_ x
| |
Assimétrico para a Esquerda: A maior parte dos valores está na parcela superior da distribuição. Uma longa cauda e uma distorção para a esquerda são causadas por alguns valores extremamente pequenos. Os valores pequenos puxam a média aritmética para baixo: média < mediana.
_ x
| |
Simétrico: A média é igual a mediana; portanto, os valores são bem distribuídos.
_ x
| |
-------------------------------------------------------------------------------------------------------
Blox-plot
| |
Valor mínimo Q1 mediana Q3 valor máximo
Outlier Outlier
Q1 -1,5*(Q3-Q1) Q3 + 1,5* (Q3 – Q1)
(cerca esquerda) (cerca direita)
• Cálculo do Outlier – Zscore (Z)
Z é o cálculo usado para identificar se há outlier ou não na distribuição.
O Z não faz parte da amostra. _
Z = x - x S
Se o Z correspondente for < - 3 ou > 3, não há outlier; ou seja, se Z:[-3;3] não é outlier.
* Resposta: Não existe outlier na amostra porque nenhuma observação é < - 3 ou > 3.
*** Se forem dados a mediana e o quartil, fazer o blox-plot.
*** Se forem dados a média e o desvio padrão, calcule o Z.