Estudando rlm
Tabela de Dados............................................................................................................................8
Problema a ser resolvido
O problema a ser resolvido consiste no ajuste de um modelo que melhor descreva a característica de interesse de uma população. No estudo a ser apresentado, a variável resposta consistirá na porcentagem de pobres no ano 2000 (Y), um indicador social que explicita a representatividade da população incapaz de garantir seu próprio sustento na população total do município.
As variáveis a serem usadas para prever tal característica são em número de 6, a citar:
X1 – Taxa de urbanização do município considerado no ano 2000;
X2 – Taxa de crescimento acumulada no período 1991 – 2000;
X3 – Porcentagem de indigentes na população do município em 2000;
X4 – Índice de violência do município em 2000;
X5 – Densidade demográfica do município em 2000;
X6 – Existência (ou não) no município de serviço de Internet em 2000;
Dados e fonte
Os dados a serem analisados no estudo que segue foram extraídos do Sistema de Informações Sócio-Econômicas dos Municípios Brasileiros (SIMBRASIL), disponível no banco de dados do site: http://www.nadd.prp.usp.br/cis/index.aspx. O acesso deu-se no dia 28 de maio de 2010.
A tabela de dados original categorizava os municípios brasileiros segundo características próprias e também segundo sua dimensão institucional, urbana e econômica. O arquivo original contava com 5 planilhas do Excel, e mais de 250 variáveis. Dessas, foram selecionadas 6 variáveis preditoras, sendo 5 quantitativas e 1 qualitativa. Ademais uma variável resposta do tipo intervalar foi considerada como a variável resposta de interesse. A tabela obtida inicialmente continha dados referentes a vários anos.