Regressão
FLAVIA CONDE KNEIP Mestranda do PGOB Orientanda do Prof. KINAS
Estrutura das aulas Serão 2 aulas: 1. Teórica – conceitos da técnica. 2. Prática – exercícios no caderno e no Excel.
CORRELAÇÃO e REGRESSÃO
No Capítulo anterior (Inferência com base em 2 Amostras) foram estudados casos que envolviam 1 VARIÁVEL e 2 POPULAÇÕES. Ex. Alturas (1 VARIÁVEL) de Homens e Mulheres (2 POPULAÇÕES).
Alturas x Homens (cm) 170 182 179 y Mulheres (cm) 165 168 151
168 155
CORRELAÇÃO e REGRESSÃO
Agora vamos estudar casos que envolvem 2 VARIÁVEIS e 1 POPULAÇÃO. 2 VARIÁVEIS correspondem a uma amostra de Dados Emparelhados. Ex. Pesos e Comprimentos (2 VARIÁVEIS ) de Ursos (1 POPULAÇÃO).
Comprimento (in.) 53,0 67,5 72,0 72,0 73,5 68,5 73,0 37,0 80 344 416 348 262 360 332 34 y Peso (lb ) x Tab. 9.1 – Ursos
Comprimento (in.) 53,0 67,5 72,0 72,0 73,5 68,5 73,0 37,0 80 344 416 348 262 360 332 34 y Peso (lb ) x Procurar determinar se há relação entre as 2 VARIÁVEIS e, caso haja, identificar a relação. CORRELAÇÃO É usada para determinar SE há RELACIONAMENTO entre 2 VARIÁVEIS.
RELACIONAMENTO
CORRELAÇÃO
Importância⇒ a presença de uma correlação pode conduzir-nos a um método para estimar uma variável a partir da outra. Ex: Estimar o PESO de ursos medindo seu COMPRIMENTO PESAR MEDIR
SUPOSIÇÕES: 1. A amostra de Dados Emparelhados (x,y) é aleatória; 2. Os pares de dados (x,y) têm Distribuição Normal Bivariada (significa que para qquer valor fixo de x os valores correspondentes de y têm distribuição em forma de sino e que para qquer valor fixo de y os valores correspondentes de x têm distribuição em forma de sino). A segunda Suposição é difícil de se verificar. Comumente se faz a verificação parcial onde se observa se x e y têm distribuição em forma de sino.
A RELAÇÃO entre as variáveis é evidenciada pela formação de um PADRÃO no Diagrama de Dispersão.
Ursos
450 400 350 300 250 200 150 100 50 0 30 40 50 60 Comprimento