Trabalho de modelo linear generalizado
ENCE
1º RELATÓRIO DE MODELOS LINEARES GENERALIZADOS
Daniela Buarque de Macedo de Souza e Hyago Souza Nascimento
Rio de Janeiro Maio – 2013
Introdução
Neste presente trabalho serão ajustados dois modelos lineares generalizados para expressar a variável resposta em função das variáveis explicativas. O conjunto de dados referente a este trabalho é composto por 95 observações correspondentes aos empregados de uma determinada empresa. A variável resposta, ou dependente, é a renda. As variáveis explicativas, ou independentes, são anos de estudo, índice de satisfação com a empresa, distância da empresa até a residência do empregado e tempo de empresa do empregado (em anos).
Um pouco de Teoria
Um modelo linear generalizado, ou MLG, consiste na generalização de um modelo linear clássico. Neste novo tipo de modelo, a variável resposta pode ter distribuição diferente da normal. Um MLG é composto por 3 componentes : Componente aleatória: Variável resposta, cuja distribuição pertence à família exponencial. Componente determinística: Os parâmetros associados às covariáveis (Xβ=ɳ). Chamamos ɳ de preditor linear. Função de ligação: é uma função que relaciona o preditor linear à média.
X é a matriz de covariáveis dada por:
1 X= 1 .... 1
x11 x21
x12 ... x22 ... ...
x1p x2p ... xnp
xn1
x22 ...
E β é o vetor de parâmetros dado por:
β=
β0 β1 β2 ... βp
Desenvolvimento
Parte 1 : Análise descritiva dos dados
O objetivo deste trabalho é ajustar dois modelos. Por isso, serão necessárias duas funções de ligações distintas. Para uma delas o procedimento de estimação dos parâmetros será executado e implementado no programa R. Para a outra, o modelo linear generalizado será ajustado através da função “glm” do R. Toda distribuição tem a sua correspondente função de ligação. A distribuição normal, por exemplo, tem como função de ligação a identidade (ɳ=μ). Não se sabe