00000000000000000000000
Consideremos os dois conjuntos de dados abaixo:
a) 10 11 11 11 12 12 12 12 13 14 14
b) 1 5 6 9 11 12 12 15 18 21 22
Esses conjuntos de dados apresentam valores iguais de média, mediana e moda e, no entanto, existem diferenças entre os dois conjuntos. (Média = 12, Mediana = 12 e Moda = 12).
Isto indica que necessitamos de um outro tipo de medida para distinguir os dois conjuntos de dados.
As medidas que tratam desta característica são chamadas de medidas de dispersão.
As principais medidas de dispersão que veremos são: amplitude, intervalo interquartil, desvio médio absoluto, variância e desvio padrão.
3.1 AMPLITUDE: Amplitude é a diferença entre o maior e o menor valor dos dados. Essa medida utiliza dois valores (máximo e mínimo) para o seu cálculo, e é geralmente utilizada para pequeno conjunto de dados.
O menor valor possível na amplitude é zero, quando todos os dados são iguais. Como a amplitude é calculada somente com valores externos, ela é muito influenciada por valores discrepantes.
Ex: a) 10 11 11 11 12 12 12 12 13 14 14 Amplitude = 14 – 10 = 4
b) 1 5 6 9 11 12 12 15 18 21 22 Amplitude = 22 – 1 = 21
Considerando-se os valores das amplitudes, podemos concluir que o segundo conjunto de dados é mais disperso que o primeiro.
3.2 INTERVALO INTERQUARTIL: O intervalo interquartil é a diferença entre o terceiro e o primeiro quartis, e, portanto, considera 50% dos dados e não é influenciado pelos valores discrepantes, uma vez que os valores discrepantes estão nos 25% das causas da distribuição.
Ex: Considere os seguintes dados:
10 11 11 11 12 12 12 12 13 14 14 Q1 Q3
Posição dos Quartis:
1° quartil: iQ1 = ( n + 1) x 1 = (11 + 1 ) x 1 = 3,00 (3° dado) 4 4
Q1 = 3° dado + ( 3° dado - 3° dado) x (parte decimal de i Q1)
Q1 = 11 + (11 – 11 )