Resumo de regressao
O crescimento de um organismo Y é função de 3 três fatores (X1, X2 e X3).
A equação da regressão será dada por Y = a + b1X1 + b2X2 + b3X3 + E
Y X1 X2 X3
1 75 110 26 9
2 76 95 28 7
3 82 75 34 9
4 82 90 31 4
5 76 85 29 8
6 83 80 36 11
7 76 105 25 7
8 74 120 23 5
Primeiramente, verificamos a matriz de correlação simples :
X1 X2 X3 Y
X1 1 -0,92 -0,46 -0,80
X2 -0,92 1 0,53 0,92
X3 -0,46 0,53 1 0,27
Y -0,80 0,92 0,27 1
Passo1
Verificamos qual é o maior valor de r entre os Xi e o Y. A variável X2 é a primeira a entrar no modelo. A correlação entre Y e X2 é de 0,92. Então, R2 = 0,85, ou seja, 85% da variância de Y é explicada pela variável X2. O resíduo é de 1- 0,85 = 0,15, ou seja, falta ainda explicar 15% da variação de Y.
Passo 2
Calculamos as correlações parciais entre Y e as outras variáveis mantendo X2 constante. Temos:
R Y/X1 0,56
R Y/X3 - 0,68
A próxima variável a ser introduzida é X3, com coeficiente de determinação de
–0,682 = 0,46, explicando 46% do resíduo anterior de 15%, ou seja, 0,46*0,15 = 0,069 (6,9%). O modelo Y = X2 + X3 explica 0,85 + 0,069 = 0,92 (92%) da variação de Y.
O novo resíduo será de 0,15 – 0,069 = 0,081 (8,1%).
Passo 3
Agora só falta incluir X1 no modelo. A correlação parcial entre X1 e Y é de 0,56, com coeficiente de determinação de 0,562 = 0,31, explicando 31% do resíduo anterior de 8,1%, ou seja, 0,31*0,081 = 0,025 (2,5%). O modelo Y = X2 + X3 + X1 explica, então, 0,92 + 0,025 = 0,945 (94,5%) da variabilidade. Este é o valor do R múltiplo.
Finalizando
Y = a + b1X1 + b2X2 + b3X3 + E
Onde os coeficientes b são calculados através do sistema de equações formado pelos coeficientes de correlação simples entre as variáveis independentes e a variável dependente:
que é resolvido pela regra de Cramer, obtendo a seguinte equação:
A equação da regressão será Y = a + 0,09X1 + 1,2X2 - 0,52X3 + E
Substituindo-se Y e