Correlação
O presente capítulo busca apresentar o estudo de correlação, como uma introdução ao estudo da regressão linear simples. Dividiu-se então em três subseções. A primeira subseção apresenta o conceito de correlação e algumas ideias a seu respeito. A segunda demonstra os aspectos algébricos relacionados ao coeficiente de correlação. A terceira é a resolução de um exercício proposto em Koutsoyiannis (1977, p. 46).
2.1 Conceito
Segundo Wonnacott e Wonnacott (1978, p. 98), correlação e regressão estão “[...] intimamente ligadas matematicamente, a correlação torna-se muitas vezes um auxílio útil na análise de regressão”. Conceitualmente, correlação é uma medida do grau de associação entre variáveis. Entretanto, cabe fazer algumas ressalvas sobre esta medida. Embora correlação seja comumente associada à causalidade, isso é um erro: causalidade e correlação não é a mesma coisa. Correlação pode sugerir causalidade, ao indicar que as variáveis estão associadas, porém não há identificação de causa e efeito. De fato, até a regressão se baseia em relações de causalidade hipotéticas. Diferente da regressão, não pode se falar em variáveis dependentes ou independentes, apenas em variáveis aleatórias (GUJARATI; PORTER, 2011, p. 43-44). Isto é, a variável X não tem o efeito quantificável em Y , como no caso da regressão, podendo-se apenas afirmar que elas variam simultaneamente com determinado grau de associação.
2.2 O coeficiente de correlação
Antes de analisar diretamente o cálculo da correlação linear, é interessante lembrar o cálculo da covariância. Conceitualmente, covariância e correlação são bastante similares, mudando apenas quando ao modo de interpretação das estatísticas, já que a correlação é uma grandeza contida no intervalo 1,1 , como será visto mais adiante. Define-se covariância populacional como
S XY E X i X Yi Y ou, ainda, considerando xi e yi os desvios das observações em relação à média,
(2.1)
11