Utilizando R na PNAD
Resumo
Este trabalho tem como objetivo, fazer algumas análises sobre a
Pesquisa Nacional por Amostra de Domicílios de 2011 (PNAD2011) utilizando a linguagem R. Os dados foram retirados do site do Instituto
Brasileiro de Geografia e Estatística (IBGE).
Primeiramente foi procurado analisar, a renda média nacional dos
Arquitetos, e também será feita algumas tabelas.
Logo em seguida, foi calculada a renda média dos Arquitetos do estado de São Paulo.
Por fim, criei uma função no qual informando o Estado, ela retornará a renda média dos arquitetos deste Estado.
OBS: Seguirá em anexo junto com este trabalho, um arquivo txt como todos os comandos e a base dados também em txt, que utilizei neste trabalho. Basta abrir o arquivo trabalhoR.txt com o Rstudio e executar que mostrará todos os resultados que será descrito aqui.
Começaremos lendo a base de dados.
Para isso utilizei a função “ read.fwf ”. Como mostrado abaixo estou dizendo como deve ser lida a base de dados, ou seja, o vetor está dizendo o
tamanho de cada variável. Por exemplo, a primeira variável será os quatros primeiros números, a segunda variável os próximos dois números, e assim sucessivamente. Para evidenciar melhor segue uma figura abaixo. Retirada do arquivo em Excel do site do IBGE chamado dicionários de variáveis, foi neste arquivo que nos baseamos para construir a função.
Vamos ler as seguintes variáveis:
Nome
V0101
UF
V0302
V8005
V0404
V4011
V06111
V06112
V9906
V9008
V9532
V4729
Inicio
1
5
18
27
33
43
86
87
153
162
321
751
Tamanho
4
2
1
3
1
1
1
1
4
2
12
5
Descrição
Ano de referencia
Unidade da Federação
Sexo
Idade em anos
Cor ou raça
Estado civil
Internet
Internet móvel
Código da ocupação
Posição na ocupação
Rendimento mensal
Peso pessoa
A variável UF termina posição 7, e a variável V0302 começa na posição 18, então entre essas duas variáveis temos um intervalo de 11 posições, que