Covariância e correlação de valores
BACHARELADO EM ADMINISTRAÇÃO
Ana Luísa Martins Macedo
Bruno H. de Oliveira Ávila
Isadora Prates F. Alvim
Laura Almeida Marçal
Estatística
Trabalho Final
Belo Horizonte
2013
Covariância e Coeficiente de Correlação
Quando estudamos a relação entre duas variáveis X e Y devemos primeiramente compreender o conceito de covariância. Se a variância é uma estatística através da qual chegamos ao desvio padrão que é uma medida de dispersão, da mesma maneira a covariância é uma estatística através da qual chegamos ao coeficiente de correlação que mede o grau de associação “linear” entre duas variáveis aleatórias X e Y.
Observe o exemplo abaixo. Sejam X e Y duas variáveis aleatórias quaisquer, que tomam os seguintes valores:
Na tabela acima está uma ilustração dos cálculos dos componentes da covariância e correlação.
A Figura abaixo mostra a relação entre as duas variáveis X e Y, bem como a linha ajustada a esses valores pelo método de mínimos quadrados.
Observe que a média de X é 5,5 e a média de Y é 6,0, e que elas estão formadas pelas linhas paralelas ao eixo Y e ao eixo X respectivamente. Vejamos agora o que significa os desvios de cada ponto em relação a média. Observe que cada ponto está formado pelo par ordenado (Xi, Yi), onde Xi indica o valor da variável X e Yi o valor da variável Y naquele ponto.
Tome agora, por exemplo,
DesvioX = (X9-X)=( 9 -5,5) = + 3,5 e Desvio Y =(Y9-Y)=(11-6,0) = + 5,0
O produto dos desvios:
Desvíos X DesvioY = (X9-X)*(Y9-Y) = (9 -5,5)*(11-6,0) = (+ 3,5)*(+5,0)=17,5
Se calcularmos esses produtos para todos os valores de X e Y e somarmos temos o numerador da covariância de X e Y:
Logo, covariância significa co-variação, como as duas variáveis variam de forma conjunta. Agora, vejamos o que acontece se os pontos estivessem no quadrante I. Neste caso, os desvios de X seriam todos positivos, enquanto que os desvios de Y seriam todos negativos, logo os produtos