ANOVA
Análise de Variância para Regressão Linear Múltipla
Introdução
Após entender como estimar e interpretar os coeficientes de um modelo de RLM pelo
MQ, é necessário iniciar a análise da qualidade do ajuste. Em outras palavras, é preciso verificar em que medida podemos inferir sobre a relação linear entre as variáveis na população a partir do que observamos na amostra.
Passos essencias para essa análise são a elaboração da tabela ANOVA e o cálculo do coeficiente de determinação. Embora com procedimentos muito semelhantes aos da RLS, essa análise da variabilidade dos resíduos com múltiplas variáveis independentes possui algumas peculiaridades e requer cuidados especiais na interpretação.
1. Coeficiente de determinação e estatística F
Assim como em RLS, a análise dos resíduos é fundamental para compreender a qualidade do ajuste de RLM. O primeiro passo na análise dos resíduos é decompor a soma total dos quadrados (STQ) em: somada dos quadrados da regressão (SQReg), e dos resíduos (SQRes).
Embora análoga à da RLS, ressalva-se o fato de que agora as distâncias da soma dos quadrados
(SQ) referem-se ao ajuste de um plano de um espaço de k+1 dimensões (k+1= k variáveis independentes + 1 variável dependente), não mais simplesmente de uma reta em um espaço de 2 dimensões. As SQs em suas respectivas notações matriciais serão dadas por:
Soma Total dos Quadrados (STQ)
Representa variabilidade total da variável depedente: n n
STQ (Yi Y) yi y y nY
2
i 1
2
T
(1)
2
i 1
Soma dos Quadrados da Regressão (SQReg)
Variabilidade da variável dependente explicada pelo conjunto das k variáveis independentes do modelo: n SQ Re g (Yˆi Y )2 βˆ T XT y nY 2 i 1
1
(2)
Análise de Variância para RLM
Soma dos Quadrados dos Resíduos (SQRes)
Variabilidade da variável dependente não explicada pelo conjunto das variáveis independentes:
(3)
n
SQ Re s (Yi Yˆi )2 eˆ T eˆ y