Dispersão linear
Considere-se a tabela seguinte, que apresenta o bónus recebido pelos funcionários de uma dada empresa, expresso em euros (variável y), e o respectivo tempo de serviço, em meses (variável x).
O gráfico de dispersão, bem como o cálculo do coeficiente de correlação de Pearson, r, evidenciam forte correlação positiva.
O Excel permite adicionar rectas de tendência em modo gráfico, mas esse procedimento não é recomendado, visto que corresponde a desenhar as rectas “a olho”.
A forma mais comum de calcular as rectas de regressão é através do Método dos Mínimos Quadrados.
Representando a recta de regressão pela fórmula:
y = a + bx
em que y é a variável dependente, x é a variável independente, a é uma constante que indica a distância da intercepção do eixo dos yy, b é uma constante que indica o declive da recta.
Evidentemente que os valores de a e b podem calcular-se no Excel, usando-o como um caderno quadriculado apenas um pouco mais sofisticado. Como é suposto o acompanhamento do blogue pelos manuais, apenas se indicam abaixo as fórmulas de cálculo de a e de b:
Para calcular a e b por este processo é preferível utilizar as fórmulas computacionais, que são equivalentes às anteriores, mas mais simples:
Seguindo este processo será necessário realizar os seguintes cálculos adicionais:
E então será fácil chegar aos valores da recta de regressão:
Outra alternativa é utilizar as funções da biblioteca do Excel.
O a calcula-se com a função INTERCEPTAR.
O b calcula-se através da função DECLIVE.
A previsão pode fazer-se por substituição directa de valores na função y = 80.77773 + 1.138005 x ou utilizando a função PREVISÃO. Para um funcionário com 45 meses de serviço, ambos os processos estimam um bónus de 131.988 €.
A qualidade da regressão é indicada pelo Coeficiente de Determinação:
O Coeficiente de Determinação varia entre 0 (zero) e 1