Desvio padrão e variância
Em probabilidade e Estatística, o desvio padrão é a medida mais comum da dispersão estatística. O desvio padrão define-se como a raiz quadrada da variância. É definido desta forma de maneira a dar-nos uma medida da dispersão que: 1. seja um número não negativo; 2. use a mesma unidade de medida dos dados fornecidos inicialmente.
Faz-se uma distinção entre o desvio padrão σ (sigma) do total de uma população ou de uma variável aleatória, e o desvio padrão s de um subconjunto em amostra.
O termo desvio padrão foi introduzido na estatística por Karl Pearson no seu livro de 1894: "Sobre a dissecção de curvas de frequência assimétricas".
Definição e cálculo
Desvio padrão de uma variável aleatória
O desvio padrão de uma variável aleatória X é definido como: [pic]
Onde [pic]é o valor esperado de X.
Nem todas as variáveis aleatórias possuem desvio padrão, porque esses valores esperados não precisam existir. Por exemplo, o desvio padrão de uma variável que flui em uma distribuição de Cauchy é indefinido.
Desvio padrão amostral
Se uma variável aleatória [pic]toma os valores [pic], então o desvio padrão para esta amostra de n números (ou desvio padrão amostral) pode ser calculado da seguinte forma. Primeiro calcula-se a média de [pic], [pic], através de: [pic]
(veja notação sigma). Depois, o desvio padrão amostral é calculado como: [pic]
A divisão por n − 1 aparece quando exigimos que a variância amostral [pic]seja um estimador não tendencioso da variância populacional [pic].
Quando os dados estão agrupados (frequência) temos: [pic]
Onde k é o número de observações diferentes.
Em outras palavras, o desvio padrão amostral de uma variável aleatória X pode ser calculada como: 1. Para cada valor xi calcula-se a diferença [pic]entre xi e o valor médio [pic]. 2. Calcula-se o quadrado dessa diferença. No caso dos dados estarem tabelados (com frequências), multiplica-se cada um destes quadrados