regressao e correlacao linear
REGRESSÃO LINEAR
1
CORRELAÇÃO E REGRESSÃO
LINEAR
Objetivo
Estudar a relação entre duas variáveis quantitativas.
Exemplos:
Idade e altura das crianças
Tempo de prática de esportes e ritmo cardíaco
Tempo de estudo e nota na prova
Taxa de desemprego e taxa de criminalidade
Expectativa de vida e taxa de analfabetismo
2
Investigaremos a presença ou ausência de relação linear sob dois pontos de vista:
a) Quantificando a força dessa relação: correlação.
b) Explicitando a forma dessa relação: regressão.
Representação gráfica de duas variáveis quantitativas:
Diagrama de dispersão
3
Correlação
Avalia a existência de associação entre 2 variáveis quantitativas:
1. Posso
correlacionar
investimento
com
ocorrência de lucro?
2. Posso correlacionar tempo de estudo com nota boa?
4
Coeficiente de correlação de Pearso
Mede:
• o grau de associação.
• o quanto a associação é linear.
• o grau de dispersão das observações ao redor de uma reta hipotética.
• Quanto maior a dispersão, menor será o Coeficiente.
Apresenta variação entre: - 1 e +1
5
Linearidade da associação
6
Linearidade da associação
7
Atenção
O coeficiente de correlação mede quanto a associação é linear, mas não podemos interpretar: r = 0.3 como havendo uma concordância de 30% entre as duas variáveis
8
Interpretação do coeficiente de correlação
• r pequeno não quer dizer que não existe associação entre duas variáveis
• a relação pode não ser linear
• r2 indica a quantidade da variabilidade que é explicada pela associação
ATENÇÃO: r indica associação e não causalidade
9
Correlação não informa
• Qual será o valor de uma variável, de acordo com o valor de outra.
• Não permite que seja estimado o efeito de uma variável. 1
Coeficiente de correlação linear de Pearso
É uma medida que avalia o quanto a “nuvem de pontos” no diagrama de dispersão aproxima-se de uma reta. O coeficiente de correlação linear de Pearson é dado por: sendo que,
X e Y são as médias amostrais de X e