DADOS DISCREPANTES
Fonte: www.starshipnivan.com
Outliers... Como ter certeza?
IDENTIFICAÇÃO DE PONTOS
DISCREPANTES
•
A identificação de um ponto estatisticamente discrepante é importante porque este ponto é uma indicação de que ocorreu uma anomalia no processo, um erro na medição, um erro grosseiro, ou uma flutuação estatística excepcional.
• Pontos estatisticamente discrepantes podem distorcer a estimativa da média.
Por este motivo, é interessante eliminálos da amostra. É válido, se o software permitir colocar no gráfico os pontos
MAS sem utilizá-los em qualquer cálculo. Outliers... Como ter certeza?
IDENTIFICAÇÃO DE PONTOS DISCREPANTES
• Os pontos da amostra devem estar ordenados.
• Examina-se, inicialmente, o ponto mais afastado da média. Se ele for discrepante, é eliminado, observando-se o seguinte.
• O ponto discrepante não deve ser eliminado, se a diferença em relação à média for menor que a diferença admissível d.
• A diferença admissível d é a maior diferença que ainda não é considerada significativa. • É o erro aceitável. Ao definir um valor, deve-se ter em mente que erros menores que 1% são difíceis de serem obtidos.
• Em pesquisa tecnológica, às vezes se aceita erros de 10% ou mais.
• Eliminado o ponto, recalcula-se a média e o desvio padrão.
• O processo deve ser repetido, até que todos os pontos discrepantes sejam eliminados, ou até que tenham sido eliminados 1/3 dos pontos (a amostra restante não deverá conter menos de 2/3 dos pontos originais).
• A média e o desvio padrão, calculados com a amostra remanescente, representam melhor os valores verdadeiros.
Critério μ 3 σ (Xbarra 3S)
Q1 - 1,5 DIQ, Q3+1,5DIQ
Cerca Inferior
Cerca Superior
Outliers
98,25
217,41
66
147,5
175,5
66
DIQ = 3Q – 1Q; 2Q = Mediana
1Q = 158; 2Q = 160; 3Q = 165 DIQ?
DIQ = 165-158 = 7 1,5Q = 10,5 μ = 157,83 σ = 19,86 3σ = 59,58
Recordista mundial...
•
•
•
Conheça um genuíno outlier*:
Chandra Bahadur Dangi
Nascido em 1930, no Nepal, na