Outliers
Outliers
Definição
As observações que apresentam um grande afastamento das restantes ou são inconsistentes com elas.
Estas observações são também designadas por observações
“anormais”, contaminantes, estranhas ou aberrantes.
Outliers
O Que Fazer?
A preocupação com observações outliers é antiga e data das primeiras tentativas de analisar um conjunto de dados, inicialmente pensava-se que a melhor forma de lidar com este tipo de observações seria através da sua eliminação da análise.
As opiniões não eram unânimes: uns defendiam a rejeição das observações “inconsistentes com as restantes”, enquanto outros afirmavam que as observações nunca deveriam ser rejeitadas simplesmente por parecerem inconsistentes com os restantes dados e que todas as observações deviam contribuir com igual peso para o resultado final.
Outliers
Causas do Aparecimento
Antes de decidir o que deverá ser feito às observações outliers é conveniente ter conhecimento das causas que levam ao seu aparecimento. Em muitos casos as razões da sua existência determinam as formas como devem ser tratadas. Assim, as principais causas que levam ao aparecimento de outliers são:
Erros de medição;
Erros de execução;
Variabilidade inerente dos elementos da população.
Outliers
Aplicações Práticas
Detecção de fraudes
O comprovante de comprar de alguém que rouba um cartão de crédito é provavelmente diferente daquele do proprietário do cartão.
Detecção de intrusões
Ataques em sistemas de computadores apresentam comportamento diferente do comportamento usual dos sistemas.
Perturbações em ecossistemas
Furações, secas, enchentes, ondas de calor, incêndios.
Saúde pública
Casos de varíola são considerados anomalias, que podem indicar um problema com o processo de vacinação na cidade.
Medicina
Para um certo paciente, certos sintomas ou resultados de testes podem indicar problemas de saúde.
Etc.
Outliers