Correlação e regressão
> Objetivo: Entender como duas variáveis estão interrelacionadas do ponto de vista estatístico. > Subobjetivo: Construir um modelo de regressão linear. Método 1: Gráfico de dispersão (scatterplot). Método 2: Coeficiente de Correlação (regressão linear).
Correlação e Regressão Correlação e Regressão Noções Básicas (slide 2) Slide 2
Correlação Positiva: ocorre quando um atributo tende a aumentar, o outro também tende a aumentar.
Correlação e Regressão Correlação e Regressão Noções Básicas (slide 3) Slide 3
Correlação Negativa: ocorre quando um atributo tende a aumentar, o outro tende a diminuir.
9. Correlação entre Atributos Correlação e Regressão Noções Básicas (slide 4) Slide 4
Correlação Nula [caso 1: var(X1)=var(X2)]: não há um padrão definido de tendência.
9. Correlação entre Atributos Correlação e Regressão Noções Básicas (slide 5) Slide 5
Correlação Nula [caso 2: var(X1)var(X2)]: também ocorre quando ao aumentar um atributo não há mudança significativa nos valores do outro atributo.
9. Correlação entre Atributos Correlação e Regressão Noções Básicas (slide 6) Slide 6
Método 2 Coeficiente de Correlação r(X1,X2) = Onde: cov(X1,X2) dp(X1) . dp(X2)
dp(X1) = desviopadrão de X1 = var(X1) dp(X2) = desviopadrão de X2 = var(X2) cov(X1,X2) = covariância entre X1 e X2 Note que: 1 Os coeficientes a e b são chamados, respectivamente, de coeficiente angular (inclinação) e o intercepto (offset) da reta de tendência. Eles são calculados por: a= dp(X2) dp(X1) . r(X1,X2) e b = X2 - aX1
9. Correlação entre Atributos Correlação e Regressão Slide 10 Noções Básicas (slide 10)
• Definição Importante > A adequação do modelo, i.e. a qualidade do ajuste do modelo aos dados é avaliada pelo Coeficiente de Determinação (R2): SQE Syy Syy = ( yi – y )2 i=1 Ni
R =1-
2
em que:
^ SQE = (yi