TAD Texto07
1532 palavras
7 páginas
1IADE – U Creative University
LICENCIATURA EM MARKETING E PUBLICIDADE
Tratamento e Análise de Dados
TEXTO 7
3. ASSOCIAÇÃO E RELAÇÕES ENTRE VARIÁVEIS.
3.1. CORRELAÇÃO E REGRESSÃO.
3.1.1 O conceito de covariância.
Até este ponto da matéria temos estado a fazer uma análise univariada. O conceito de variância situa-se num contexto multivariado. Vamos aqui considerar uma análise bivariada. Em termos simplificados, considerando-se as variáveis aleatórias X e Y, define-se covariância entre essas variáveis, COV( X,Y), do seguinte modo:
COV (X,Y)= E X X Y Y = E(x,y) =
xy i i
n
x e y são variáveis centradas e n é o número de observações.
Exemplo do cálculo a covariância.
X e Y são as notas de 10 alunos em duas disciplinas.
X
Y
20
18
16
15
14
12
12
10
8
5
12
16
10
14
12
10
9
8
7
2
X =130 Y =100
X =13
Y 10
x
y
7
5
3
2
1
-1
-1
-3
-5
-8
2
6
0
4
2
0
-1
-2
-3
-8
xy
14
30
0
8
2
0
1
6
15
64
xy 140
xy =14 n - Covariância positiva significa que a valores de X superiores à média estão associados valores de Y superiores à média ou então que a valores de X inferiores à média estão associados valores de Y inferiores à média.
Carlos Garrido
2
- Covariância negativa significa que a valores de X superiores à média estão associados valores de Y inferiores à média ou então que a valores de X inferiores à média estão associados valores de Y superiores à média.
3.1.2. O coeficiente de correlação amostral (r ) e o índice de determinação (r2)
A covariância é influenciada pelas unidades em que X e Y são medidas.
Para corrigir esta limitação divide-se a covariância pelos desvios padrões das variáveis. r= x y nS S i X
i
Y
A r chama-se coeficiente de correlação amostral, que varia entre -1 e +1.
Utilizando o quadro exemplo anterior, calculemos então o coeficiente r.
Comecemos por calcular os desvios padrões das variáveis.
X
Y
20
18
16
15
14
12
12
10
8
5
12
16
10
14
12
10
9
8
7
2
X =130 Y =100
SY =
1
2
=
x i n
y
7
5
3
2
1
-1
-1