Teoria da correlação e regressão
CENTRO DE CIÊNCIAS E TECNOLOGIA
ENGENHARIA QUÍMICA
PROBABILIDADE E ESTATÍSTICA
TEORIA DA CORRELAÇÃO E REGRESSÃO
Recife, 07 de novembro de 2012.
Correlação e Regressão
Existe um conjunto de métodos estatísticos que visam estudar a associação entre duas ou mais variáveis aleatórias. Dentre tais métodos, a teoria da regressão e correlação ocupa um lugar de destaque por ser o de uso mais difundido. Neste trabalho serão abordados os fundamentos dos métodos estatísticos da correlação e regressão. Analisaremos o comportamento simultâneo das variáveis, tomadas duas a duas, verificando se a variação positiva (ou negativa) de uma delas está associada a uma variação positiva (ou negativa) da outra, ou mesmo, se não há nenhuma forma de dependência entre elas. Nesse sentido, uma primeira abordagem exploratória é a elaboração de um diagrama de dispersão entre as observações simultâneas das variáveis. O diagrama de dispersão permite visualizar o grau de associação entre as variáveis e a tendência de variação conjunta que apresentam.
Coeficiente de Correlação Linear de Pearson
O coeficiente de correlação de Pearson é uma medida do grau de relação linear entre duas variáveis quantitativas. Este coeficiente varia entre os valores -1 e 1. O valor 0 (zero) significa que não há relação linear, o valor 1 indica uma relação linear perfeita e o valor -1 também indica uma relação linear perfeita mas inversa, ou seja quando uma das variáveis aumenta a outra diminui. Quanto mais próximo estiver de 1 ou -1, mais forte é a associação linear entre as duas variáveis.
O coeficiente de correlação de Pearson é normalmente representado pela letra r e a sua fórmula de cálulo é:
Testes de Hipóteses sobre o Coeficiente de Correlação
Os N pares de valores (X, Y) de duas variáveis pode ser pensado como amostras de uma população de todos pares possíveis. Uma vez que duas variáveis são envolvidas, isto é chamado de uma POPULAÇÃO BIVARIADA, a