Estatistica medidas de dispersao
O resumo de um conjunto de dados por uma única medida representante de posição (tendência central), omite toda observação sobre a variabilidade dos dados. Por exemplo, suponhamos que as notas dos alunos A e B em uma determinada disciplina, nas 5 avaliações da mesma, foram:
A (variável X): 1; 3; 5; 7; 9 B (variável Y): 3,5; 5; 5; 5; 6,5
Temos que as médias aritméticas: [pic] = [pic] = 5 A identificação de cada uma dessas séries por sua média (5 em ambos os casos), nada nos informa sobre as diferentes variabilidades. Notamos então a conveniência de serem criadas medidas que sumarizam a variabilidade de um conjunto de observações. Um critério freqüentemente usado para esse fim é o que mede a dispersão em torno de sua média, e duas medidas geralmente usadas são: Desvio-Médio e Variância, que são definidos, respectivamente por:
[pic]
[pic]
onde n é o número total de observações. Para os alunos A e B, citados:
DM (X) = [pic] = 2,4 e DM (Y) = [pic] = 0,6
Var (X) = [pic] = 8 e DM (Y) = [pic] = 0,9
Observação: Sendo a variância uma medida de dispersão que tem como unidade de medida o quadrado da unidade dos dados originais isso pode causar dificuldades de interpretação. Em razão disso, podemos utilizar como uma outra medida de dispersão, o desvio padrão, o qual é definido como a raiz quadrada positiva da variância, ou seja,
S =[pic]
Assim, para os alunos A e B, teremos:
S = [pic] e S = [pic]
Exemplo: Calcular as medidas de dispersão para a variável X = número de filhos dos funcionários, dados pela tabela 1.2.:
Tabela 1.2. Dados correspondentes ao número de filhos dos funcionários casados de uma repartição pública.
|Nº de Filhos ([pic]) |Freqüência ([pic]) |Freqüência Relativa ([pic]) |Porcentagem 100*[pic] |
|0