Análise de Regressão
Fonte: Applied Linear Statistical Models. Neter, J. Wasserman, W. & Kutner, M. H. 3. ed. Exercício 7.20, p.267
Um pesquisador em uma fundação científica quis avaliar a relação entre salários anuais nivelados intermediários e sênior dos matemáticos da pesquisa (Y, em mil dólares) e um índice da qualidade da publicação (), o número dos anos da experiência (), e um índice do sucesso em obter a sustentação da concessão (). Os dados para uma amostra de 24 matemáticos nivelados intermediários e sênior da pesquisa seguem.
Primeiramente fazemos uma análise estatística para sintetizar as variáveis e termos uma visão da variação desses valores. Y
Mínimo : 3.100 5.00 3.500 30.10
1º Quartil : 4.425 17.25 5.000 35.70
Mediana : 5.400 25.00 6.000 38.85
Média : 5.358 24.96 5.987 39.50
3º Quartil : 6.275 33.25 7.000 42.92
Máximo : 8.000 47.00 8.300 52.90
Variância : 1.667754 125.9547 1.699402 29.96783
Desvio padrão : 1.291415 11.22295 1.303611 5.474288
Cor() = 0.4669511 Cor() = 0.3227612 Cor() = 0.253753
Podemos ver que existe uma correlação bem fraca entre as variáveis independentes, assim vamos fazer o modelo de regressão utilizando todas essas variáveis.
O modelo de regressão será dado por:
, i=1,2,...,24.
é o i-ésimo valor da variável resposta; são parâmetros; é o i-ésimo valor da j-ésima variável independente e é o termo do erro aleatório, com E()=0 e Var()= e não correlacionados ( ,)=0 para todo i ≠ j).
A equação de regressão estimada é dada por:
,
onde obtemos = 17,8469306, = 1.1031304 , = 0.3215197 e = 1.2889409.
Assim, a equação de regressão estimada é dada por:
= 17,8469306 + 1.1031304 + 0.3215197 + 1.2889409 .
Para termos as