Estatística Aplicada
xi - x . fi
DMS = fi Veja como chegamos à idéia de “dispersão”..
Em 3 rodas de amigos, pesquisamos as notas que tinham obtido em um trabalho da faculdade. Cada grupo tinha 6 pessoas e identificamos cada grupo com as letras A, B e C.
As notas que obtiveram foram:
A: {4; 3; 2; 3; 1; 5}
B:{6; 0; 0; 3; 3; 6}
C:{3; 3; 3; 3; 3; 3}
Para comparar o desempenho desses grupos de alunos, podemos começar calculando a média de cada um deles.
(4 + 3 + 2 + 3 + 1 + 5)
XA =
= 3
6
(6 + 0 + 0 + 3 + 3 + 6)
XB =
= 3
6
XC =
(3 + 3 + 3 + 3 + 3 + 3)
= 3
6
As médias nos 3 grupos é a mesma!
Assim precisamos utilizar outro parâmetro de comparação. Vamos trabalhar com a idéia de
DISPERSÃO em torno da média.
Quanto cada nota se “desviou” da média? Comparamos cada nota individual com a média calculada (3):
4-3=1
-1
0
-2
3
6-3=3
-3
-3
0
0
3
0
xi - x
0
0
0
0
0
0
Esses desvios podem ser sumarizados na fórmula de um Desvio Médio
Simples:
O módulo evita que o
DM= xi - x total de desvios seja zero! n Chamamos de Variância a média aritmética dos quadrados dos desvios:
Note que dividimos por n - 1
O Desvio Padrão é uma importante medida de dispersão obtida por meio da raiz quadrada da Variância:
Para obter a Variância e consequentemente o Desvio Padrão, construímos uma tabela de frequências para a série considerada: xi xi - x
(xi -x)2
Calculando o DP para A, B e C, obtemos DPA = 2; DPB = 2,68 e
DPC = 0.
O Desvio Padrão é a mais importante medida de dispersão dos dados - como se comportam em torno da Média dos valores.
A somatória dessa coluna dividida por n - 1 é a Variância:
A raiz quadrada da Variância é o Desvio Padrão:
Obs: No EXCEL, utilizamos:
Recapitulando:
A Variância é uma medida aritmética calculada