Grau de Liberdade
Grau de liberdade é, em estatística, o número de determinações independentes (dimensão da amostra) menos o número de parâmetros estatísticos a serem avaliados na população.
É um estimado do número de categorias independentes num teste particular ou experiência estatística. Encontram-se mediante a fórmula n-1, onde n é o número de elementos na amostra (também podem ser representados por k-1 onde k é o número de grupos, quando se realizam operações com grupos e não com sujeitos individuais).
Exemplo: Supondo um caso de herança onde há duas características, uma dominante outra recessiva.
O número de graus de liberdade é nesse caso: 2 – 1 = 1, pois GL = n - 1, em que n = número de classes
Paralelamente, no caso de lançamento de um dado seriam 5 os graus de liberdade, já que \n = 6, pois há seis faces no dado.
Entretanto, se os dados estiverem tabelados, evidentemente, deve-se considerar apenas a área dos dados. O valor de GL é assim calculado:
GL = (número de linhas -1) x (número de colunas -1) O termo variância já apareceu diversas vezes neste texto. O que seria variância, afinal de contas? Eu poderia dizer que variância é o quadrado do desvio-padrão.
Contudo ressalvaria que essa afirmativa, ainda que matematicamente correta, é, todavia estatisticamente incorreta. Isto porque, na verdade, o que se calcula primeiro é
A variância da amostra. Só depois é que se extrai a sua raiz quadrada.
Variância e graus de liberdade. Tecnicamente, a variância vem a ser a soma de todos os desvios dos dados amostrais, em relação à média, elevados ao quadrado, soma essa que depois é dividida por (n-1), ou seja, pelo número de graus de liberdade da amostra. Graus de liberdade, por sua vez, não é mais que o número total de dados da amostra, menos 1. Por que esses desvios são elevados ao quadrado? E por que se divide por (n-1), e não simplesmente por n? As respostas a essas duas perguntas parecem-me simples:
1. elevam-se os desvios ao quadrado