O projeto pnad2013 tem o propósito de facilitar o acesso aos dados sobre a população Brasileira publicados pelo IBGE. Ao invés de requerer programas como SAS ou as linguagens como R, utiliza a linguagem Python e a biblioteca Pandas.
É necessário ter o Python instalado, além disso, é sugerido o virtualenvwrapper para isolamento de ambientes.
Abra o terminal e digite:
$ pip install -r requirements.txt
Como citado, o IBGE disponibiliza esses dados para o software
GNU R e outros programas
proprietários. Porém, o script que gera o output final precisa da
descrição da estrutura do arquivo Dados/PES2013.txt
no pacote
disponibilizado pelo IBGE.
O arquivo de input Input/input PES2013.txt
compatível com o programa
proprietário SAS foi manualmente convertido pra um formato menos
complexo e está disponível nesse mesmo repositório, chamado
input.txt
.
Para converter o arquivo de dados, execute:
$ python convert.py input.txt <pacote-do-IBGE>/Dados/PES2013.txt > PES2013.csv
Para obter um CSV com os campos Região, Faixa etária, Renda, N, Peso e N * P, execute no terminal:
$ python pnad2013.py PES2013.csv > output.csv