Multicolinearidade- estatística
Texto complementar
Os resultados apresentados nos textos foram feitos com a base de dados da aula que vimos no LEPI.
Um exemplo com 3 variáveis independentes quantitativas
Modelo matemático:
Modelo estatístico:
Quando as variáveis independentes Xi são correlacionadas entre si, a inclusão de todas num modelo de regressão deverá causar o efeito “multicolinearidade” que ocorre da seguinte forma:
- Valor p do teste global baixo
-Valores p dos testes parciais altos ou estimativas de beta i pouco precisas.
Suponha que a matriz correlação bivariada na amostra seja: | Y | X1 | X2 | X3 | Y | 1 | | | | X1 | 0,795267 | 1 | | | X2 | 0,734855 | 0,679488 | 1 | | X3 | 0,778901 | 0,764799 | 0,992356 | 1 | | | | | |
As correlações de Y com X1, Y com X2 e Y com X3 indicam que qualquer uma das variáveis isoladamente será boa para explicar a variação de Y com R2=0,63; 0,54 e 0,61 respectivamente.
Entretanto as correlações entre X1 e X2, X1 e X3, e X2 e X3 são altas principalmente X2 com X3 cuja correlação é próxima de 1. Isso significa que se eu tiver um modelo com X1 e X2, aumentar o número de variáveis com o intuito de reduzir a variação de Y pode não ser adequado. Em outros termos, a variável X3 não trará contribuição adicional significativa ao modelo.
Antes de ver a regressão múltipla, vamos analisar as funções estimadas das 3 regressões simples para n=80
Y com X1: com R2=0,632; Se= 30,95 e Valor p do teste F = 0,00
O modelo é estatisticamente significativo e podemos afirmar que a cada unidade adicional de X1, Y aumenta, em média, 4,34 unidades.
Y com X2: com R2=0,540; Se= 34,63 e Valor p do teste F = 0,00
O modelo é estatisticamente significativo e podemos afirmar que a cada unidade adicional de X2, Y aumenta, em média, 7,71 unidades.
Y com X3: com R2=0,607; Se= 32,02 e Valor p do teste F = 0,00
O modelo é estatisticamente significativo e podemos afirmar que a cada unidade adicional de