<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Arquivos Cleiton Rocha - Estatidados</title>
	<atom:link href="http://estatidados.com.br/category/professores-colaboradores/cleiton-rocha/feed/" rel="self" type="application/rss+xml" />
	<link>http://estatidados.com.br</link>
	<description>Comunidade de Estatística</description>
	<lastBuildDate>Thu, 09 Jun 2022 20:11:51 +0000</lastBuildDate>
	<language>pt-BR</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.0.5</generator>
	<item>
		<title>Utilizando o R para obter decretos relacionados ao COVID-19 no Brasil</title>
		<link>http://estatidados.com.br/utilizando-o-r-para-obter-decretos-relacionados-ao-covid-19-no-brasil/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=utilizando-o-r-para-obter-decretos-relacionados-ao-covid-19-no-brasil</link>
					<comments>http://estatidados.com.br/utilizando-o-r-para-obter-decretos-relacionados-ao-covid-19-no-brasil/#respond</comments>
		
		<dc:creator><![CDATA[admin]]></dc:creator>
		<pubDate>Wed, 30 Sep 2020 12:32:58 +0000</pubDate>
				<category><![CDATA[Cleiton Rocha]]></category>
		<category><![CDATA[Linguagens de programação]]></category>
		<guid isPermaLink="false">http://estatidados.com.br/?p=446</guid>

					<description><![CDATA[<p>Introdução No Brasil, diante da emergência sanitária mundial, as autoridades estabeleceram diversas portarias/decretos com regras e normas para funcionamento de serviços de saúde e serviços não essenciais. Na maioria das unidades da federação, as aulas na rede pública e na<a class="leiamais" href="http://estatidados.com.br/utilizando-o-r-para-obter-decretos-relacionados-ao-covid-19-no-brasil/" title="Utilizando o R para obter decretos relacionados ao COVID-19 no Brasil">...[Continuar lendo]</a></p>
<p>O post <a rel="nofollow" href="http://estatidados.com.br/utilizando-o-r-para-obter-decretos-relacionados-ao-covid-19-no-brasil/">Utilizando o R para obter decretos relacionados ao COVID-19 no Brasil</a> apareceu primeiro em <a rel="nofollow" href="http://estatidados.com.br">Estatidados</a>.</p>
]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-image size-large is-resized"><img src="http://estatidados.com.br/wp-content/uploads/2020/09/1_oi17URjs9Oy7cTH9zMzMlw.png" alt="" class="wp-image-447" width="893" height="412" srcset="http://estatidados.com.br/wp-content/uploads/2020/09/1_oi17URjs9Oy7cTH9zMzMlw.png 814w, http://estatidados.com.br/wp-content/uploads/2020/09/1_oi17URjs9Oy7cTH9zMzMlw-300x139.png 300w, http://estatidados.com.br/wp-content/uploads/2020/09/1_oi17URjs9Oy7cTH9zMzMlw-200x93.png 200w, http://estatidados.com.br/wp-content/uploads/2020/09/1_oi17URjs9Oy7cTH9zMzMlw-400x185.png 400w" sizes="(max-width: 893px) 100vw, 893px" /></figure>



<h1 id="a45a">Introdução</h1>



<p>No Brasil, diante da emergência sanitária mundial, as autoridades estabeleceram diversas portarias/decretos com regras e normas para funcionamento de serviços de saúde e serviços não essenciais.</p>



<p>Na maioria das unidades da federação, as aulas na rede pública e na rede privada foram suspensas. Eventos com grande número de pessoas foram proibidos. Houve mudanças no transporte público, com redução de frota, e alterações nas regras de abertura de comércios, bares, restaurantes e shoppings.</p>



<p>O objetivo dessas restrições era de evitar a sobrecarga dos serviços de saúde e esgotamento dos leitos de tratamento, à medida que, a União, Estados e Municípios poderiam se preparar para o aumento no número de casos com a construção de hospitais de campanha e importação de respiradores.</p>



<p>Ao longo dos últimos meses os decretos vêm sendo moldados de acordo com a realidade da pandemia no país. Mudanças como aumento das restrições de circulação e expansão na oferta de crédito, foram mais recentemente transformadas em medidas de reabertura de algumas atividades econômicas com estruturas e horários de funcionamento diferenciados, entre outros tipos. Uma forma de olhar o panorama do Covid-19 no país é observando como os agentes políticos legislaram a respeito do tema.</p>



<p>No texto a seguir explico como gerar um banco de dados no R com informações atualizadas sobre os decretos nos níveis municipal, estadual e federal, com registro da data, sua classificação em decreto ou lei e algumas outras informações.</p>



<p>Vamos lá!</p>



<hr class="wp-block-separator"/>



<h1 id="5008">Carregando os dados e os pacotes no R</h1>



<p>A fonte dos dados vem do site&nbsp;<a href="https://leismunicipais.com.br/">https://leismunicipais.com.br/</a>, que é totalmente confiável, tanto que vários municípios utilizam a ferramenta. Você pode encontrar mais informações sobre eles&nbsp;<a href="https://leismunicipais.com.br/institucional">aqui</a>.</p>



<p>O ‘Leis Municipais’ vem mantendo uma&nbsp;<a href="https://leismunicipais.com.br/coronavirus">página</a>&nbsp;com dados sobre os decretos relacionados ao Covid-19, é dessa página que vamos extrair as informações, de dentro do R, é claro.</p>



<pre class="wp-block-preformatted"># Pacotes<br>library(dplyr)<br>library(tidyr)<br>library(purrr)<br>library(xml2)<br>library(stringr)<br>library(rvest)<br>library(mgsub)<br>library(gsubfn)<br>library(lubridate)# Pasta de trabalho - altere o caminho para onde os arquivos serão salvos #<br>setwd("C:\\Users\\pc\\Desktop\\Cidacs\\ETL")########################################################<br>#### DECRETOS POR ESTADO<br>########################################################Acre &lt;- read.csv2("<a href="https://leismunicipais.com.br/coronavirus?estado=AC">https://leismunicipais.com.br/coronavirus?estado=AC</a>", encoding =  'UTF-8', sep=",", stringsAsFactors = F) %&gt;% mutate(Estado = "Acre")Alagoas &lt;- read.csv2("<a href="https://leismunicipais.com.br/coronavirus?estado=AL">https://leismunicipais.com.br/coronavirus?estado=AL</a>", encoding =  'UTF-8', sep=",", stringsAsFactors = F) %&gt;% mutate(Estado = "Alagoas")Amapá &lt;- read.csv2("<a href="https://leismunicipais.com.br/coronavirus?estado=AP">https://leismunicipais.com.br/coronavirus?estado=AP</a>", encoding =  'UTF-8', sep=",", stringsAsFactors = F)  %&gt;% mutate(Estado = "Amapá")Amazonas &lt;- read.csv2("<a href="https://leismunicipais.com.br/coronavirus?estado=AM">https://leismunicipais.com.br/coronavirus?estado=AM</a>", encoding =  'UTF-8', sep=",", stringsAsFactors = F) %&gt;% mutate(Estado = "Amazonas")Bahia&lt;- read.csv2("<a href="https://leismunicipais.com.br/coronavirus?estado=BA">https://leismunicipais.com.br/coronavirus?estado=BA</a>", encoding =  'UTF-8', sep=",", stringsAsFactors = F) %&gt;% mutate(Estado = "Bahia")Ceará &lt;-read.csv2("<a href="https://leismunicipais.com.br/coronavirus?estado=CE">https://leismunicipais.com.br/coronavirus?estado=CE</a>", encoding =  'UTF-8', sep=",", stringsAsFactors = F) %&gt;% mutate(Estado = "Ceará")Distrito_Federal&lt;- read.csv2("<a href="https://leismunicipais.com.br/coronavirus?estado=DF">https://leismunicipais.com.br/coronavirus?estado=DF</a>", encoding =  'UTF-8', sep=",", stringsAsFactors = F) %&gt;% mutate(Estado = "Distrito Federal")Espírito_Santo &lt;-read.csv2("<a href="https://leismunicipais.com.br/coronavirus?estado=ES">https://leismunicipais.com.br/coronavirus?estado=ES</a>", encoding =  'UTF-8', sep=",", stringsAsFactors = F) %&gt;% mutate(Estado = "Espírito Santo")Goiás &lt;- read.csv2("<a href="https://leismunicipais.com.br/coronavirus?estado=GO">https://leismunicipais.com.br/coronavirus?estado=GO</a>", encoding =  'UTF-8', sep=",", stringsAsFactors = F) %&gt;% mutate(Estado = "Goiás")Maranhão &lt;- read.csv2("<a href="https://leismunicipais.com.br/coronavirus?estado=MA">https://leismunicipais.com.br/coronavirus?estado=MA</a>", encoding =  'UTF-8', sep=",", stringsAsFactors = F) %&gt;% mutate(Estado = "Maranhão")Mato_Grosso &lt;- read.csv2("<a href="https://leismunicipais.com.br/coronavirus?estado=MT">https://leismunicipais.com.br/coronavirus?estado=MT</a>", encoding =  'UTF-8', sep=",", stringsAsFactors = F) %&gt;% mutate(Estado = "Mato Grosso")Mato_Grosso_do_Sul &lt;-read.csv2("<a href="https://leismunicipais.com.br/coronavirus?estado=MS">https://leismunicipais.com.br/coronavirus?estado=MS</a>", encoding =  'UTF-8', sep=",", stringsAsFactors = F) %&gt;% mutate(Estado = "Mato Grosso do Sul")Minas_Gerais &lt;- read.csv2<br>("<a href="https://leismunicipais.com.br/coronavirus?estado=MG">https://leismunicipais.com.br/coronavirus?estado=MG</a>", encoding =  'UTF-8', sep=",", stringsAsFactors = F) %&gt;% mutate(Estado = "Minas Gerais")Pará &lt;- read.csv2("<a href="https://leismunicipais.com.br/coronavirus?estado=PA">https://leismunicipais.com.br/coronavirus?estado=PA</a>", encoding =  'UTF-8', sep=",", stringsAsFactors = F) %&gt;% mutate(Estado = "Pará")Paraíba  &lt;- read.csv2("<a href="https://leismunicipais.com.br/coronavirus?estado=PB">https://leismunicipais.com.br/coronavirus?estado=PB</a>", encoding =  'UTF-8', sep=",", stringsAsFactors = F) %&gt;% mutate(Estado = "Paraíba")Paraná  &lt;- read.csv2("<a href="https://leismunicipais.com.br/coronavirus?estado=PR">https://leismunicipais.com.br/coronavirus?estado=PR</a>", encoding =  'UTF-8', sep=",", stringsAsFactors = F)  %&gt;% mutate(Estado = "Paraná")Pernambuco &lt;- read.csv2("<a href="https://leismunicipais.com.br/coronavirus?estado=PE">https://leismunicipais.com.br/coronavirus?estado=PE</a>", encoding =  'UTF-8', sep=",", stringsAsFactors = F)  %&gt;% mutate(Estado = "Pernambuco")Piauí &lt;- read.csv2("<a href="https://leismunicipais.com.br/coronavirus?estado=PI">https://leismunicipais.com.br/coronavirus?estado=PI</a>", encoding =  'UTF-8', sep=",", stringsAsFactors = F)  %&gt;% mutate(Estado = "Piauí")Rio_de_Janeiro &lt;- read.csv2("<a href="https://leismunicipais.com.br/coronavirus?estado=RJ">https://leismunicipais.com.br/coronavirus?estado=RJ</a>", encoding =  'UTF-8', sep=",", stringsAsFactors = F) %&gt;% mutate(Estado = "Rio de Janeiro")Rio_Grande_do_Norte &lt;- read.csv2("<a href="https://leismunicipais.com.br/coronavirus?estado=RN">https://leismunicipais.com.br/coronavirus?estado=RN</a>", encoding =  'UTF-8', sep=",", stringsAsFactors = F) %&gt;% mutate(Estado = "Rio Grande do Norte")Rio_Grande_do_Sul  &lt;- read.csv2("<a href="https://leismunicipais.com.br/coronavirus?estado=RS">https://leismunicipais.com.br/coronavirus?estado=RS</a>", encoding =  'UTF-8', sep=",", stringsAsFactors = F)  %&gt;% mutate(Estado = "Rio Grande do Sul")Rondônia &lt;- read.csv2("<a href="https://leismunicipais.com.br/coronavirus?estado=RO">https://leismunicipais.com.br/coronavirus?estado=RO</a>", encoding =  'UTF-8', sep=",", stringsAsFactors = F) %&gt;% mutate(Estado = "Rondônia")Roraima &lt;- read.csv2("<a href="https://leismunicipais.com.br/coronavirus?estado=RR">https://leismunicipais.com.br/coronavirus?estado=RR</a>", encoding =  'UTF-8', sep=",", stringsAsFactors = F) %&gt;% mutate(Estado = "Roraima")Santa_Catarina  &lt;- read.csv2("<a href="https://leismunicipais.com.br/coronavirus?estado=SC">https://leismunicipais.com.br/coronavirus?estado=SC</a>", encoding =  'UTF-8', sep=",", stringsAsFactors = F) %&gt;% mutate(Estado = "Santa Catarina")São_Paulo &lt;- read.csv2("<a href="https://leismunicipais.com.br/coronavirus?estado=SP">https://leismunicipais.com.br/coronavirus?estado=SP</a>", encoding =  'UTF-8', sep=",", stringsAsFactors = F)  %&gt;% mutate(Estado = "São Paulo")Sergipe &lt;- read.csv2("<a href="https://leismunicipais.com.br/coronavirus?estado=SE">https://leismunicipais.com.br/coronavirus?estado=SE</a>", encoding =  'UTF-8', sep=",", stringsAsFactors = F) %&gt;% mutate(Estado = "Sergipe")Tocantins &lt;- read.csv2("<a href="https://leismunicipais.com.br/coronavirus?estado=TO">https://leismunicipais.com.br/coronavirus?estado=TO</a>", encoding =  'UTF-8', sep=",", stringsAsFactors = F) %&gt;% mutate(Estado = "Tocantins")</pre>



<p>O que foi feito aqui é bem simples: eu gerei um&nbsp;<em>dataset&nbsp;</em>dos decretos em cada estado, usando como fonte o link do site. Também foi criado uma coluna com o nome do respectivo estado. O que precisa ser feito agora? Ponto para quem disse unir tudo isso.</p>



<pre class="wp-block-preformatted">####################################################<br>######## Dataset com todos os decretos, por Estado<br>####################################################DECRETOS_ESTADOS &lt;- list(Acre,Alagoas,Amapá,Amazonas,<br>                         Bahia,Ceará,Distrito_Federal,<br>                         Espírito_Santo,Goiás,<br>                         Maranhão,Mato_Grosso,Mato_Grosso_do_Sul,<br>                         Minas_Gerais,Pará,Paraíba,<br>                         Paraná, Pernambuco, Piauí,<br>                         Rio_de_Janeiro,Rio_Grande_do_Norte,<br>                         Rio_Grande_do_Sul,Rondônia,Roraima,<br>                         Santa_Catarina,São_Paulo,<br>                         Sergipe,Tocantins) %&gt;%<br>                  reduce(full_join, by = c("X.U.FEFF.Epigrafe",<br>                                           "Localidade","Ementa",<br>                                           "Url","Estado")) %&gt;%<br>                    rename(Decretos = "X.U.FEFF.Epigrafe")</pre>



<p>E prontinho! Agora temos um banco de dados com todos os estados. Observem que utilizei a função&nbsp;<em>reduce.&nbsp;</em>Ela é do pacote<em>&nbsp;purrr&nbsp;</em>e ajuda na hora de unir todos os bancos, para que não seja necessário unir de dois em dois, com o&nbsp;<em>reduce&nbsp;</em>eu faço a união de todos simultaneamente. A união (ou merge) em si é feita com a função&nbsp;<em>full_join&nbsp;</em>do&nbsp;<em>dplyr,&nbsp;</em>nela eu informo as colunas em comum que serão usadas como base para agregar os dados. Depois eu renomeei o nome de uma coluna para um nome mais agradável (cá entre nós, “X.U.FEFF.Epigrafe” não é um bom nome para uma coluna).</p>



<p>Nossa base de dados tem essa cara por enquanto:</p>



<figure class="wp-block-image is-resized"><img loading="lazy" src="https://miro.medium.com/max/976/1*8yZxKOhc8uQulWYuNEaMMg.png" alt="Image for post" width="763" height="463"/></figure>



<p>Agora nos precisamos saber se o decreto é municipal ou estadual. Para isso, basta criar uma coluna e aplicar um&nbsp;<em>ifelse</em>&nbsp;usando a ‘localidade’ como informação. Vejam:</p>



<pre class="wp-block-preformatted">### Criando coluna 'Tipo' com informação se o decreto é Estadual ou MunicipalDECRETOS_ESTADOS &lt;- DECRETOS_ESTADOS %&gt;% mutate(Tipo="")DECRETOS_ESTADOS$Tipo &lt;- ifelse(DECRETOS_ESTADOS$Localidade %in%   c("Acre","Alagoas","Amapá","Amazonas",<br>  "Bahia","Ceará","Distrito Federal",<br>  "Espírito Santo","Goiás","Maranhão",<br>  "Mato Grosso","Mato Grosso do Sul",<br>  "Minas Gerais","Pará","Paraíba","Paraná",<br>  "Pernambuco","Piauí","Rio de Janeiro",<br>  "Rio Grande do Norte","Rio Grande do Sul",<br>  "Rondônia","Roraima","Santa Catarina",<br>  "São Paulo","Sergipe","Tocantins"), "Estadual", "Municipal")</pre>



<p>Agora é necessário incluir os decretos federais. É legal ter um pouco de noção em&nbsp;<em>webscrapping</em>&nbsp;e&nbsp;<em>html</em>. Vamos ver.</p>



<hr class="wp-block-separator"/>



<h1 id="456c">Incluindo os Decretos Federais</h1>



<p>O site do Governo Federal para obter as informações sobre a legislação sobre o COVID-19 é&nbsp;<a href="http://www.planalto.gov.br/ccivil_03/Portaria/quadro_portaria.htm">esse</a>. Se você acessar o site vai notar que ele tem uma interface bem simples, mas não tem nele uma opção de baixar os dados, por isso, precisamos “raspar” as informações que queremos diretamente da página. O R oferece uma gama de opções para raspar informações de páginas da web, o R Selenium é a mais popular, mas aqui optei por usar o&nbsp;<a href="https://en.wikipedia.org/wiki/PhantomJS">PhantomJs</a>.</p>



<p>Faça o download do PhantomJs acessando a página deles, que é&nbsp;<a href="https://phantomjs.org/download.html">essa aqui</a>. Feito o download e depois de descompactar, coloque o arquivo&nbsp;<em>phantomjs.exe&nbsp;</em>na pasta de trabalho que você definiu (a minha, por exemplo, é&nbsp;<em>“C:\\Users\\pc\\Desktop\\Cidacs\\ETL”</em>), basta olhar o primeiro script, no começo do texto, caso não se recorde.</p>



<p>Certo, com o arquivo na pasta, vamos voltar para o R.</p>



<pre class="wp-block-preformatted">###################################################################<br>###### Decretos Federais - Capturando página e gerando ela em HTML <br>###################################################################writeLines("var url = '<a href="http://www.planalto.gov.br/ccivil_03/Portaria/quadro_portaria.htm'">http://www.planalto.gov.br/ccivil_03/Portaria/quadro_portaria.htm'</a>;<br>var page = new WebPage();<br>var fs = require('fs');page.open(url, function (status) {<br>        just_wait();<br>});function just_wait() {<br>    setTimeout(function() {<br>               fs.write('dec_federal.html', page.content, 'w');<br>            phantom.exit();<br>    }, 2500);<br>}<br>", con = "scrape.js")js_scrape &lt;- function(url = "<a href="http://www.planalto.gov.br/ccivil_03/Portaria/quadro_portaria.htm">http://www.planalto.gov.br/ccivil_03/Portaria/quadro_portaria.htm</a>", <br>                      js_path = "scrape.js", <br>                      phantompath = "phantomjs.exe"){<br>  <br>  lines &lt;- readLines(js_path)<br>  lines[1] &lt;- paste0("var url ='", url ,"';")<br>  writeLines(lines, js_path)<br>  <br>  command = paste(phantompath, js_path, sep = " ")<br>  system(command)<br>  <br>}js_scrape()###################################################################<br>######### Carregando o HTML convertido<br>################################################################### lendo o html<br>html2 &lt;- read_html("dec_federal.html", encoding="UTF-8")# criando formato de tabela com dados do html<br>html_tabela &lt;- html2 %&gt;% html_nodes("table") %&gt;% html_table(fill = T)fed_covid &lt;- html_tabela[[3]]# Ajustando nome das colunas<br>fed_covid &lt;- fed_covid %&gt;% rename(Decretos = "X1") %&gt;% rename(Ementa = "X2")# Ajustando dados no dataset (Excesso de espaçamento, etc)<br>fed_covid$Decretos &lt;- gsub("[\t\n]", "", fed_covid$Decretos)<br>fed_covid$Ementa &lt;- gsub("[\t\n]", "", fed_covid$Ementa)fed_covid$Decretos &lt;- gsub("\\s+"," ", fed_covid$Decretos)<br>fed_covid$Ementa &lt;- gsub("\\s+"," ", fed_covid$Ementa)# Criando coluna 'Tipo' e 'Localidade'<br>fed_covid &lt;- fed_covid %&gt;% mutate(Tipo="Federal") %&gt;% mutate(Localidade="Brasil")</pre>



<p>Na primeira parte do código, o PhantomJs pelo R é usado para acessar a página do planalto e gerar um arquivo em html. Usando esse arquivo em html, na segunda parte do código, foi utilizada algumas funções do pacote&nbsp;<em>rvest&nbsp;</em>para pegar as informações em html e transformá-la em uma tabela. Após isso, foi necessário aplicar alguns processos de limpeza e ajuste nos dados: renomear colunas, usar um pouco de conhecimento em regex para retirar espaçamento em excesso e por fim criar uma coluna ‘Tipo’ e ‘Localidade’.</p>



<p>Essa é a cara do nosso dataset de decretos federais:</p>



<figure class="wp-block-image"><img src="https://miro.medium.com/max/733/1*NpDhsDRcVj-WSk1Wy26uKw.png" alt="Image for post"/></figure>



<p>O próximo passo é fazer um merge entre os decretos federais e o restante.</p>



<pre class="wp-block-preformatted">##################################################################<br>######## Dataset unindo decretos Federais, Estaduais e Municipais<br>##################################################################Decretos_Covid_Brasil &lt;- full_join(DECRETOS_ESTADOS, fed_covid, by=c("Decretos","Localidade","Ementa","Tipo"))</pre>



<hr class="wp-block-separator"/>



<h1 id="7fa5">Criando coluna ‘Tipo do documento’ e limpando os dados</h1>



<p>Para saber se o documento é uma Lei, Decreto ou Portaria é preciso usar a função&nbsp;<em>word</em>&nbsp;do pacote&nbsp;<em>stringr</em>. Essa função pega a primeira palavra de cada linha de determinada coluna, no caso, a coluna ‘Decretos’. Também, por questão de limpeza nos dados, é bom deixar o nome do município, na coluna ‘Localidade’, sem nenhum tipo de ‘/’ ou algo que atrapalhe na busca pelo seu nome.</p>



<pre class="wp-block-preformatted">#### Criando coluna 'Tipo do Documento'Decretos_Covid_Brasil$Tipo_Documento &lt;- word(Decretos_Covid_Brasil$Decretos)### Retirando '/' depois do nome do município <br>Decretos_Covid_Brasil$Localidade &lt;- gsub("\\/.*","",Decretos_Covid_Brasil$Localidade)### Removendo coluna não utilizada<br>Decretos_Covid_Brasil$Url &lt;- NULL</pre>



<hr class="wp-block-separator"/>



<h1 id="8db3">Inserindo o código dos municípios</h1>



<p>Para ajudar na hora de buscar por um determinado município, é sempre melhor usar o código dele do que o nome. Isso porque muitas vezes ocorrem erros de digitação, problemas com acentuação, entre outros. Por isso, é prudente acrescentar uma coluna com o código dos municípios.</p>



<p>Como a coluna que contém o nome dos municípios também tem o nome dos estados, é necessário criar uma condição para que apenas municípios sejam registrados (Para não ter problema, por exemplo, com estados que também tem nome de municípios, como SP ou RJ).</p>



<pre class="wp-block-preformatted">############################################################################## Carregando dataset com códigos dos municípios<br>####################################################################codigos_igbe &lt;- read.csv2("<a href="https://raw.githubusercontent.com/CleitonOERocha/Scripts/master/Decretos%20Covid/codigo_municipios_IBGE.csv">https://raw.githubusercontent.com/CleitonOERocha/Scripts/master/Decretos%20Covid/codigo_municipios_IBGE.csv</a>",<br>                          encoding = "ISO-8859-1", stringsAsFactors = F)### Merge entre códigos e dataset<br>Decretos_Covid_Brasil &lt;- left_join(Decretos_Covid_Brasil, codigos_igbe, by = c("Localidade","Estado"))### Criando condições para registrar apenas Municípios, e não Estados <br>  Decretos_Covid_Brasil$Codigo_Municipio &lt;- ifelse(Decretos_Covid_Brasil$Tipo == "Municipal",<br>                                                  Decretos_Covid_Brasil$Codigo_Municipio, NA)<br>  <br>  Decretos_Covid_Brasil$Nome_Mesorregião &lt;- ifelse(Decretos_Covid_Brasil$Tipo == "Municipal",<br>                                                   Decretos_Covid_Brasil$Nome_Mesorregião, NA)<br>  <br>  Decretos_Covid_Brasil$Cod_UF &lt;- ifelse(Decretos_Covid_Brasil$Tipo == "Municipal",<br>                                         Decretos_Covid_Brasil$Cod_UF, NA)</pre>



<hr class="wp-block-separator"/>



<h1 id="df65">Inserindo a data do decreto e gerando o banco de dados final</h1>



<p>É importante ver a data em que cada decreto foi publicado, tanto para traçar uma linha do tempo, como também para olhar o volume de decretos mês a mês. Para criar a coluna contendo a data é preciso de três pacotes:<em>&nbsp;lubridate</em>,&nbsp;<em>mgsub&nbsp;</em>e&nbsp;<em>gsubfn</em>. Depois de mostrar o script, explico melhor sobre o uso de cada um.</p>



<pre class="wp-block-preformatted">############################################################################# Criando coluna com data dos decretos <br>####################################################################<br>  <br>### criando lista com nome dos meses em português e seu respectivo número <br>  meses_pt &lt;- c("de janeiro de", "de fevereiro de",<br>                "de março de", "de abril de", "de maio de",<br>                "de junho de","de julho de", "de agosto de",<br>                "de setembro de", "de outubro de",<br>                "de novembro de", "de dezembro de")meses_numb &lt;- c("/01/", "/02/", "/03/", "/04/", "/05/", "/06/", "/07/", "/08/", "/09/", "/10/", "/11/", "/12/")### condição para filtrar data na coluna - criando coluna mês<br>  Decretos_Covid_Brasil$Decretos_date &lt;- ifelse(Decretos_Covid_Brasil$Tipo %in% c("Estadual","Municipal"), <br>         mgsub::mgsub(Decretos_Covid_Brasil$Decretos, meses_pt, meses_numb),<br>         strapplyc(Decretos_Covid_Brasil$Decretos, ", de \\d+.\\d+.\\d+", simplify = TRUE))<br>  <br>### Transformando lista em carácter<br>  Decretos_Covid_Brasil$Decretos_date &lt;- as.character(Decretos_Covid_Brasil$Decretos_date)### Criando condição para extrair datas de acordo com seu padrão<br>  Decretos_Covid_Brasil$Decretos_date &lt;- ifelse(Decretos_Covid_Brasil$Tipo %in% c("Estadual","Municipal"),<br>                                              strapplyc(Decretos_Covid_Brasil$Decretos_date, "\\d+ /\\d+/ \\d+", simplify = TRUE), <br>                                               Decretos_Covid_Brasil$Decretos_date)### Convertendo coluna para formato 'Date'<br>  Decretos_Covid_Brasil$Decretos_date &lt;- dmy(Decretos_Covid_Brasil$Decretos_date)</pre>



<p>Vamos a explicação:</p>



<p>Os decretos municipais e estaduais tem um padrão: primeiro vem o dia em formato numérico, depois o mês por extenso, seguido pelo ano em formato numérico. Já os decretos federais vem em formato numérico separados por “.”. É preciso, portanto, elaborar duas formas de extrair as datas.</p>



<p>Para os decretos municipais e estaduais: criei duas listas, a primeira com o formato que a data vem no dataset e uma outra com o formato que eu quero que os dados apareceram (/xx/). Ou seja, pretendo aqui fazer uma substituição dos caracteres para um formato de data mais conciso. Para fazer a substituição, foi utilizado a função&nbsp;<em>mgsub&nbsp;</em>do pacote de mesmo nome.</p>



<p>Para os decretos federais: Como não é necessário fazer nenhuma substituição, apenas o recorte da informação, a função&nbsp;<em>strapplyc&nbsp;</em>do pacote&nbsp;<em>gsubfn&nbsp;</em>foi utilizada. Com ela eu consigo recortar a cadeira de caracteres que desejo.</p>



<p>Com essas duas informações em mãos, foi preciso apenas fazer uma condição usando o&nbsp;<em>ifelse</em>. Mas acaba por ai? Nãaaao.</p>



<p>Depois de fazer criar esse&nbsp;<em>if&nbsp;</em>é preciso converter a coluna criada em carácter. Isso porque depois de usar a função&nbsp;<em>strapplyc</em>,o resultado é uma coluna no formato lista. Essa conversão é necessária porque é preciso criar mais uma condição. Explico:</p>



<p>Na primeira condição, apenas houve uma substituição nos valores dos decretos municipais e estaduais. É preciso, como foi feito nos decretos federais, recortar os dados desejados usando a função&nbsp;<em>strapplyc&nbsp;</em>e como não é preciso fazer mais nada com os decretos federais, apenas repete-se o nome da coluna na condição.</p>



<p>Agora que todos os dados estão recortados, contendo apenas a data, é preciso converter essa coluna para o formato correto dela, ou seja,&nbsp;<em>“Date”&nbsp;</em>(que não é de encontro, rsrs). Para isso, bastar usar a função super simples do pacote lubridate, a&nbsp;<em>dmy</em>, que os dados são automaticamente padronizados.</p>



<p>Este é o nosso banco de dados final:</p>



<figure class="wp-block-image is-resized"><img loading="lazy" src="https://miro.medium.com/max/1255/1*oi17URjs9Oy7cTH9zMzMlw.png" alt="Image for post" width="778" height="361"/><figcaption>24.057 decretos. 24.057!!!</figcaption></figure>



<hr class="wp-block-separator"/>



<h1 id="bec6">Salvando</h1>



<p>Só é preciso agora salvar. Vou salvar do seguinte modo: apenas Salvador, todos da Bahia (estaduais e municipais), Bahia (apenas estaduais), Federais e a base de dados completa, ou seja, para o Brasil todo.</p>



<pre class="wp-block-preformatted">############################################################<br>############# Dataset com todos os decretos em Salvador<br>############################################################DECRETOS_SALVADOR &lt;- Decretos_Covid_Brasil %&gt;% filter(Localidade == "Salvador")####################################################################### Dataset com todos os decretos na Bahia - Apenas Estaduais e Estaduais/Municipais ######################################################DECRETOS_BAHIA_ESTADUAL &lt;- Decretos_Covid_Brasil %&gt;% filter(Localidade == "Bahia") %&gt;% <br>                           select(Localidade, Decretos, Ementa, Tipo, Tipo_Documento) # Decretos EstaduaisDECRETOS_BAHIA_TODOS &lt;- Decretos_Covid_Brasil %&gt;% filter(Estado == "Bahia") # Decretos do Estado e Municipios#############################################<br>######## Dataset com decretos Federais<br>#############################################DECRETOS_FEDERAIS &lt;- Decretos_Covid_Brasil %&gt;% filter(Localidade == "Brasil") %&gt;% select(Localidade, Decretos, Ementa, Tipo, Tipo_Documento)###########################################################<br>########## Salvando em CSV<br>###########################################################write.csv2(DECRETOS_SALVADOR,"Decretos_em_Salvador.csv", row.names = F) # SSA<br>write.csv2(DECRETOS_BAHIA_ESTADUAL,"DecretosEstaduais_na_Bahia.csv", row.names = F) # BA Estadual<br>write.csv2(DECRETOS_BAHIA_TODOS,"Decretos_na_Bahia.csv", row.names = F) # Ba Estaduais e Municipais<br>write.csv2(Decretos_Covid_Brasil,"Decretos_Covid_Brasil.csv", row.names = F) # Todos os decretos no Brasil<br>write.csv2(DECRETOS_FEDERAIS,"Decretos_Federais.csv", row.names = F) # Federais</pre>



<hr class="wp-block-separator"/>



<h1 id="ba47">Conclusão</h1>



<p>O script completo está aqui no meu&nbsp;<a href="https://github.com/CleitonOERocha/Scripts/blob/master/Decretos%20Covid/ETL_decretos.R">GitHub</a>. Usem! Porém, levou um tempo considerável para elaborar, solucionar erros e ir aprimorando o script, então, se gostou do conteúdo e ele foi realmente útil, por favor, lembre-se de dar os créditos. Isso ajuda pra caramba <img src="https://s.w.org/images/core/emoji/14.0.0/72x72/2764.png" alt="❤" class="wp-smiley" style="height: 1em; max-height: 1em;" />.</p>



<p>Aqui estão minhas redes sociais:&nbsp;<a href="https://www.instagram.com/cleiton._r/">Instagram</a>,&nbsp;<a href="https://www.linkedin.com/in/cleitonoerocha/">LinkedIn</a>,&nbsp;<a href="https://github.com/CleitonOERocha">GitHub</a>.</p>



<hr class="wp-block-separator"/>



<h1 id="2b36">Bônus</h1>



<p>Não poderia encerrar sem construir uns gráficos, hahaha.</p>



<pre class="wp-block-preformatted">library(viridis)<br>library(dplyr)<br>library(ggplot2)<br>library(Cairo)<br>library(tidyr)<br>library(ggrepel)# Pasta de trabalho<br>setwd("C:\\Users\\pc\\Desktop\\Cidacs\\ETL")# Dados<br>Decretos_Covid_Brasil &lt;- read.csv2("Decretos_Covid_Brasil.csv")Decretos_Covid_Brasil &lt;- Decretos_Covid_Brasil %&gt;% mutate(one=1)</pre>



<p><strong>Decretos, por mês:</strong></p>



<pre class="wp-block-preformatted">######################## Gráficos - Decretos por mês ################################# Recortando apenas o mês do decreto<br>Decretos_Covid_Brasil$mes_dec &lt;- format(as.Date(Decretos_Covid_Brasil$Decretos_date), "%m")# Nome do mês<br>Decretos_Covid_Brasil$mes_dec &lt;- factor(Decretos_Covid_Brasil$mes_dec, levels = c("01","02","03","04",<br>                                                                                  "05","06","07","08","09"),<br>                                        labels = c("Janeiro","Fevereiro","Março","Abril","Maio","Junho","Julho",<br>                                                   "Agosto","Setembro"))# Agrupando<br>total_mes &lt;- Decretos_Covid_Brasil %&gt;% <br>  group_by(mes_dec) %&gt;% <br>  summarise(total=sum(one)) %&gt;% <br>  drop_na()# gráfico<br>graph_mes &lt;- ggplot(total_mes, aes(fill = mes_dec, y = total, x =mes_dec)) +<br>  geom_bar(position = "dodge", stat = "identity") +<br>  geom_text(aes(label=total),size = 2.5, position =position_dodge(width=0.9),<br>             vjust=-0.5, color = 'black',fontface='bold') +<br>  theme_classic() +<br>  theme(axis.title.x = element_text(colour = "black"),<br>        axis.title.y = element_text(colour = "black"),<br>        axis.text.y = element_text(face="bold", color="#000000", <br>                                   size=8),<br>        axis.line = element_line(colour = "black", <br>                                 size = 1, linetype = "solid"),<br>        axis.text=element_text(size=6, face="bold"),<br>        axis.text.x = element_text(face="bold", color="#000000", size=10),<br>        plot.title = element_text(colour = "black", size = 17, hjust=0.5),<br>        legend.position = "none") +<br>  labs(x = "", y="", caption = "Fonte: <a href="https://leismunicipais.com.br//nDados">https://leismunicipais.com.br/\nDados</a> coletados em 08/09/2020",<br>       title = "Total de decretos no Brasil, por mês") +<br>  scale_fill_viridis(discrete=TRUE,option = "B") +<br>  scale_y_discrete(limits=factor(0:6000), breaks = c(0,1000,2000,3000,4000,5000,6000), name = "")# Salvando em PNG<br>ggsave(plot = graph_mes, "graph_mes.png",<br>       width = 10, height = 5, dpi = 120, units = "in",type = "cairo")</pre>



<figure class="wp-block-image is-resized"><img loading="lazy" src="https://miro.medium.com/max/1080/1*G4Uq_K7LwNLFydSXCteJ3A.png" alt="Image for post" width="674" height="338"/></figure>



<p><strong>Por ato normativo:</strong></p>



<pre class="wp-block-preformatted">######################## Tipo de ato normativo #################### Agrupando <br>total_doc &lt;- Decretos_Covid_Brasil %&gt;% <br>  group_by(Tipo_Documento) %&gt;% <br>  summarise(total=sum(one)) %&gt;% <br>  drop_na()# Classificando decretos menores que 100 em 'Outros'<br>total_doc$Tipo_Documento &lt;- ifelse(total_doc$total &lt; 100,"Outros",<br>                                   total_doc$Tipo_Documento)# reagrupando e calculando porcentagem <br>total_doc &lt;- total_doc %&gt;% <br>  group_by(Tipo_Documento) %&gt;% <br>  summarise(total=sum(total)) %&gt;% <br>  drop_na() %&gt;% <br>  mutate(percent = total/sum(total)*100)# criando coluna com a posicao da legenda<br>total_doc &lt;- total_doc %&gt;% arrange(desc(Tipo_Documento)) %&gt;%<br>  mutate(yposicao_legenda = cumsum(percent)- 0.5*percent)# gráfico<br>ato_graph &lt;- ggplot(total_doc,aes(x= "", y= percent, fill=Tipo_Documento)) +<br>  geom_bar(width=1, stat = "identity") +<br>  coord_polar("y", start=0) +<br>   geom_label_repel(aes(y=yposicao_legenda, label = sprintf("%1.1f%%",percent)), size = 4,<br>                         color = 'black',fontface='bold') +<br>  labs(x="",y="",title = "Tipo de ato normativo", fill = "Ato normativo: ",<br>       caption = "Fonte: <a href="https://leismunicipais.com.br//nDados">https://leismunicipais.com.br/\nDados</a> coletados em 08/09/2020") +<br>  theme_minimal() +<br>  theme(legend.position="bottom",<br>        legend.background = element_rect(fill="ghostwhite", size=0.5, linetype="blank"),<br>        axis.text.x = element_text(face="bold",color="#000000", size=12),<br>        legend.text = element_text(size=10, face="bold"),<br>        legend.title = element_text(size = 8, face = "bold"),<br>        plot.title = element_text(colour = "black", size = 12, hjust=0.5, face="bold")) +<br>  scale_fill_manual(values = c("#581845","#900C3F","#C70039","#FF5733","#FFC300"))# Salvando em PNG<br>ggsave(plot = ato_graph, "ato_graph.png",<br>       width = 10, height = 5, dpi = 120, units = "in",type = "cairo")</pre>



<figure class="wp-block-image is-resized"><img loading="lazy" src="https://miro.medium.com/max/1080/1*f1Wc_y7noNp9ThFjbB1RrA.png" alt="Image for post" width="801" height="402"/></figure>



<p>O script dos gráficos vocês encontram&nbsp;<a href="https://github.com/CleitonOERocha/Scripts/blob/master/Decretos%20Covid/graf_medium.R">aqui.</a></p>



<p>#R #datascience #Rstats</p>



<p></p>
<p>O post <a rel="nofollow" href="http://estatidados.com.br/utilizando-o-r-para-obter-decretos-relacionados-ao-covid-19-no-brasil/">Utilizando o R para obter decretos relacionados ao COVID-19 no Brasil</a> apareceu primeiro em <a rel="nofollow" href="http://estatidados.com.br">Estatidados</a>.</p>
]]></content:encoded>
					
					<wfw:commentRss>http://estatidados.com.br/utilizando-o-r-para-obter-decretos-relacionados-ao-covid-19-no-brasil/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
		<item>
		<title>Trabalhando com os microdados da PNAD COVID19 no R</title>
		<link>http://estatidados.com.br/trabalhando-com-os-microdados-da-pnad-covid19-no-r/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=trabalhando-com-os-microdados-da-pnad-covid19-no-r</link>
					<comments>http://estatidados.com.br/trabalhando-com-os-microdados-da-pnad-covid19-no-r/#respond</comments>
		
		<dc:creator><![CDATA[admin]]></dc:creator>
		<pubDate>Tue, 29 Sep 2020 15:41:01 +0000</pubDate>
				<category><![CDATA[Cleiton Rocha]]></category>
		<category><![CDATA[Linguagens de programação]]></category>
		<guid isPermaLink="false">http://estatidados.com.br/?p=438</guid>

					<description><![CDATA[<p>Edit:&#160;Quando fiz esse texto, os dados da PNAD Covid-19 mais recentes foram de Maio. Recentemente, o IBGE publicou dados mais atualizados, com o mês de Junho. Por isso, estou atualizando os gráficos com os novos dados, para além disso, fiz<a class="leiamais" href="http://estatidados.com.br/trabalhando-com-os-microdados-da-pnad-covid19-no-r/" title="Trabalhando com os microdados da PNAD COVID19 no R">...[Continuar lendo]</a></p>
<p>O post <a rel="nofollow" href="http://estatidados.com.br/trabalhando-com-os-microdados-da-pnad-covid19-no-r/">Trabalhando com os microdados da PNAD COVID19 no R</a> apareceu primeiro em <a rel="nofollow" href="http://estatidados.com.br">Estatidados</a>.</p>
]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-image size-large"><img loading="lazy" width="576" height="302" src="http://estatidados.com.br/wp-content/uploads/2020/09/1_0ZYQcZAF0kv7axu9yUx9EA.png" alt="" class="wp-image-439" srcset="http://estatidados.com.br/wp-content/uploads/2020/09/1_0ZYQcZAF0kv7axu9yUx9EA.png 576w, http://estatidados.com.br/wp-content/uploads/2020/09/1_0ZYQcZAF0kv7axu9yUx9EA-300x157.png 300w, http://estatidados.com.br/wp-content/uploads/2020/09/1_0ZYQcZAF0kv7axu9yUx9EA-200x105.png 200w, http://estatidados.com.br/wp-content/uploads/2020/09/1_0ZYQcZAF0kv7axu9yUx9EA-400x210.png 400w" sizes="(max-width: 576px) 100vw, 576px" /></figure>



<p><strong>Edit:</strong>&nbsp;Quando fiz esse texto, os dados da PNAD Covid-19 mais recentes foram de Maio. Recentemente, o IBGE publicou dados mais atualizados, com o mês de Junho. Por isso, estou atualizando os gráficos com os novos dados, para além disso, fiz alguns ajustes no script.</p>



<hr class="wp-block-separator"/>



<h1 id="3bca">Introdução</h1>



<p>Os microdados da PNAD são, na minha opinião, uma das formas mais preciosas para compreender as condições socioeconômicas e demográficas do Brasil. Trata-se de uma base com ampla capilaridade e milhões de linhas repleta de informações da população brasileira. O indivíduo trabalha? Qual o valor da remuneração? Estudou até quando? Sabe ler? Como são as condições na sua residência? Nela tem água tratada? Esgoto? São questões abordadas na PNAD Continua e que servem de base para desenvolver e analisar políticas públicas diversas.</p>



<p>Em um período de pandemia, cuja solução momentânea que se mostra mais eficiente é o isolamento social, levar pesquisadores à campo para aplicar questionários da maneira habitual se mostrou uma tarefa pouco adequada. Pensando nisso e para manter a sociedade informada, o IBGE buscou contornar a situação via entrevistas realizadas por telefone. Com as informações coletadas foi gerada a PNAD COVID19. O IBGE frisa que os&nbsp;<a href="https://www.ibge.gov.br/estatisticas/investigacoes-experimentais/estatisticas-experimentais/27946-divulgacao-semanal-pnadcovid1?t=o-que-e&amp;utm_source=covid19&amp;utm_medium=hotsite&amp;utm_campaign=covid_19">dados são experimentais</a>&nbsp;e devem ser usadas com cautela, isso porque essa é uma PNAD diferente das outras, ou seja, é arriscado comparar os dados dessa PNAD com a PNADC de 2019, por exemplo. Todavia, isso não quer dizer que a informação seja inválida, longe disso, na verdade, ela fornece um olhar para o período atípico que nos encontramos.</p>



<p>Dentro do R existe uma gama de opções para analisar amostras, geralmente o pacote&nbsp;<em>Survey</em>&nbsp;é o predileto dos pesquisadores. Porém, optei pelo&nbsp;<em>srvyr</em>, por ser um pacote que fornece opções para trabalhar com o&nbsp;<em>dplyr</em>. Foquei em analisar o que se passa em Salvador, mas é possível reproduzir os resultados para outras capitais, UF’s ou simplesmente para o Brasil todo, a curiosidade de cada um é o que faz com que tenhamos novas descobertas e inovações.</p>



<p>Então, depois de toda essa explicação, vamos ao que é mais legal: botar a mão na massa!</p>



<hr class="wp-block-separator"/>



<h1 id="9dbc">Carregando pacotes e os microdados</h1>



<p>Primeira coisa: faça o download dos&nbsp;<a href="https://www.ibge.gov.br/estatisticas/investigacoes-experimentais/estatisticas-experimentais/27946-divulgacao-semanal-pnadcovid1?t=microdados&amp;utm_source=covid19&amp;utm_medium=hotsite&amp;utm_campaign=covid_19">microdados no site do IBGE</a>. Depois de descompactar, verá que existe um arquivo CSV (que são os dados) e o dicionário. Tudo bem usual pra quem já trabalhou com PNAD antes.</p>



<p>Com os dados no computador, vamos instalar os pacotes e carregar os dados no RStudio.</p>



<pre class="wp-block-preformatted">library(dplyr)<br>library(srvyr) <br>library(readr)<br>library(ggplot2)<br>library(Cairo)# Pasta de Trabalho<br>setwd("C:\\Users\\pc\\Desktop\\PNAD\\PNAD_COVID19\\PNAD_COVID_062020")# Carregando dataset<br>pnad_covid &lt;- read_csv("PNAD_COVID_062020.csv", col_types = cols(.default = "d"))</pre>



<p>O dataset completo tem 381.270 linhas e 114 colunas (woooow).</p>



<hr class="wp-block-separator"/>



<h1 id="ecce">Colocando os pesos e criando variáveis</h1>



<p>Se você abrir o dicionário da PNAD COVID19 vai notar uma variável chamada V1032. É essa variável que define o peso do domicílio e das pessoas. Precisamos ligar isso no nosso dataset. Também vou filtrar a capital para Salvador.</p>



<pre class="wp-block-preformatted"># ligando Pesos e filtrando Salvador<br>pnad_com_pesos &lt;- pnad_covid %&gt;% as_survey_design(ids = UPA, strata = Estrato, weights = V1032, nest = TRUE) %&gt;%<br>  filter(CAPITAL == "29")</pre>



<p>Agora vamos criar algumas colunas com as informações que queremos trabalhar.</p>



<pre class="wp-block-preformatted"># Criando colunas com Variáveis <br>pnad_com_pesos &lt;- pnad_com_pesos %&gt;% mutate(one = 1,<br>Sexo = ifelse(A003 == 1, "Homem", "Mulher"), <br>Idade = case_when(<br>   A002 %in% 15:24 ~ "15-24",<br>   A002 %in% 25:34 ~ "25-34", <br>   A002 %in% 35:49 ~ "35-49", <br>   A002 %in% 50:64 ~ "50-64", <br>   A002 &gt; 64 ~ "65+"),<br>Cor = case_when(<br>   A004 == 1 ~ "Branca", <br>   A004 == 2 ~ "Preta", <br>   A004 == 4 ~ "Parda"),<br>Escolaridade = factor(case_when( <br>   A005 %in% 1:2 ~ "Sem Instrução ou Fundamental Incompleto", <br>   A005 %in% 3:4 ~ "Fundamental completo ou Médio Incompleto", <br>   A005 %in% 5:6 ~ "Médio completo ou Superior Incompleto", <br>   A005 == 7 ~ "Superior completo", <br>   A005 == 8 ~ "Pós-graduação"), <br>     levels = c( "Sem Instrução ou Fundamental Incompleto",<br>                 "Fundamental completo ou Médio Incompleto", <br>                 "Médio completo ou Superior Incompleto",<br>                 "Superior completo",<br>                 "Pós-graduação")), <br>Tipo_emprego = factor(case_when(<br>   C007 == 1 ~ "Trabalhador doméstico (empregado doméstico, cuidados, babá)",<br>   C007 == 2 ~ "Militar",<br>   C007 == 3 ~ "Policial ou Bombeiro",<br>   C007 == 4 ~ "Setor privado",<br>   C007 == 5 ~ "Setor público",<br>   C007 == 6 ~ "Empregador",<br>   C007 == 7 ~ "Autônomo (Conta própria)"),<br>     levels = c( "Trabalhador doméstico (empregado doméstico, cuidados, babá)",<br>               "Militar", <br>               "Policial ou Bombeiro",<br>               "Setor privado",<br>               "Setor público",<br>               "Empregador",<br>               "Autônomo (Conta própria)")), <br>Faixa_salario = factor(case_when(<br>  C01012 &lt;= 1044 ~ "Menos de um salário mínimo",<br>  C01012 %in% c(1045:2090) ~ "Entre 1 e 2",<br>  C01012 %in% c(2091:3135) ~ "Entre 2 e 3",<br>  C01012 %in% c(3136:4180) ~ "Entre 3 e 4",<br>  C01012 %in% c(4181:5225) ~ "Entre 4 e 5",<br>  C01012 &gt;= 5226 ~ "Mais de 5"),<br>    levels = c("Menos de um salário mínimo",<br>               "Entre 1 e 2",<br>               "Entre 2 e 3",<br>               "Entre 3 e 4",<br>               "Entre 4 e 5",<br>               "Mais de 5")),<br>domicilio_situacao = factor(case_when(<br>  F001 == 1 ~ "Próprio - já pago",<br>  F001 == 2 ~ "Próprio - ainda pagando" ,                                  <br>  F001 == 3 ~ "Alugado",<br>  F001 %in% 4:6 ~ "Cedido (Por empregador, Familiar ou outro)"),<br>      levels = c("Próprio - já pago",<br>                 "Próprio - ainda pagando",<br>                 "Alugado", <br>                 "Cedido (Por empregador, Familiar ou outro)")),<br>home_office = ifelse(C013 == 1, "Home Office", "Presencial"),<br>auxilio_emergencial = ifelse(D0051 == 1, "Auxílio", "Sem auxílio")<br>)</pre>



<p>Ficaria um texto muuuuito longo se eu fosse detalhar cada etapa, mas em resumo: Foram criadas novas colunas e nelas eu apliquei um rótulo baseado nas colunas que já existem, ou seja, ao invés de uma coluna chamada A003, contendo apenas os valores 1 e 2, eu criei uma nova coluna chamada “Sexo” com as informações “Homem” e “Mulher”, assim fica mais fácil de interpretar. Para fazer sua análise, confira o dicionário que veio junto com os dados (O dicionário é muito importante, não se esqueça dele).</p>



<hr class="wp-block-separator"/>



<h1 id="4ad0"><strong>Gerando gráficos e analisando resultados</strong></h1>



<p>Um ponto importante sobre os gráficos a seguir: Cada percentual é referente ao total daquele grupo, não tendo uma relação com o percentual ao lado. Por exemplo, quando eu digo que 31,91% das mulheres de cor branca estão em home office, isso significa que 68,09% das mulheres de cor branca não estão em home office. Ou seja, cada grupo tem seu percentual próprio. Optei por fazer isso por achar mais interessante comparar cada grupo com o total dele na sociedade. Maaas, caso queiram trabalhar com gráficos em que a soma dos percentuais atinjam 100%, fiz um outro script que está disponível&nbsp;<a href="https://github.com/CleitonOERocha/Scripts/blob/master/PNAD_COVID19/PNAD_COVID_SSA_100%25.R">aqui</a>. Lá no git também tem uma pasta com os gráficos desse outro script, você poderá encontrar&nbsp;<a href="https://github.com/CleitonOERocha/Scripts/tree/master/PNAD_COVID19/Salvador%20100%25">aqui</a>. Dito tudo isso, vamos partir para as análises!</p>



<p>Primeiro vamos olhar o sexo e a cor das pessoas que estão em Home Office em Salvador.</p>



<pre class="wp-block-preformatted">############### Home office - Por sexo e cor ################### Criando dataset para conferir pessoas em Home Office<br>home_sexo_cor &lt;- pnad_com_pesos %&gt;%<br>  group_by(Sexo, Cor) %&gt;%<br>  summarise(<br>    home_office = survey_total(C013 == 1, na.rm = TRUE),<br>    mao_de_obra = survey_total(C001 == 1, na.rm = TRUE)) %&gt;%<br>  mutate(trab_home_office = (home_office/mao_de_obra)*100) %&gt;%<br>  drop_na()# gráfico<br>home_sexo_cor_ssa &lt;- ggplot(home_sexo_cor, aes(fill = Cor, y = trab_home_office, x = Sexo)) +<br>  geom_bar(position = "dodge", stat = "identity") +<br>  geom_text(aes(label=sprintf("%1.2f%%",trab_home_office)),size = 3, position =position_dodge(width=0.9),<br>            vjust=-0.5, color = 'black',fontface='bold') +<br>  theme_classic() +<br>  theme(axis.title.x = element_text(colour = "black"),<br>        axis.title.y = element_text(colour = "black"),<br>        axis.text.y = element_text(face="bold", color="#000000", <br>                                   size=10),<br>        axis.line = element_line(colour = "black", <br>                                 size = 1, linetype = "solid"),<br>        axis.text=element_text(size=6, face="bold"),<br>        axis.text.x = element_text(face="bold", color="#000000", size=10),<br>        plot.title = element_text(colour = "black", size = 17, hjust=0.5),<br>        legend.position = "bottom", legend.background = element_rect(fill="ghostwhite", size=0.7, linetype="blank")) +<br>  labs(x = "Sexo", fill = "Cor/Raça: ", caption = "Fonte: Microdados da Pnad Covid19 - IBGE. Junho 2020.",<br>       title = "Pessoas em home office, por cor/raça e sexo - Salvador/BA") +<br>  scale_fill_manual(values = c("#00b894","#ff7675","#0984e3","#6c5ce7")) +<br>  scale_y_discrete(limits=factor(0:100), breaks = c(0,10,20,30,40,50,60,70,80,90,100), name = "Percentual (%)")# Salvando<br>ggsave(plot = home_sexo_cor_ssa, "home_sexo_cor_ssa.png",<br>       width = 10, height = 5, dpi = 120, units = "in",type = "cairo")</pre>



<figure class="wp-block-image"><img src="https://miro.medium.com/max/1080/1*zZ8fBVydaEDoCab7Cj6qeA.png" alt="Image for post"/></figure>



<p>Podemos ver que mulheres de cor branca são o grupo predominante em home office, 31,91% dos indivíduos com essas duas características se encontram trabalhando em casa. Já o menor grupo são o de homens de cor preta, com um singelo percentual de 9,14%.</p>



<p>Mas e quanto ao nível de escolaridade? Como ele se comporta? Vamos observar.</p>



<pre class="wp-block-preformatted">############## Home office - Por Cor e Escolaridade ###########home_edu_cor &lt;- pnad_com_pesos %&gt;%<br>  group_by(Escolaridade, Cor) %&gt;%<br>  summarise(<br>    home_office = survey_total(C013 == 1, na.rm = TRUE),<br>    mao_de_obra = survey_total(C001 == 1, na.rm = TRUE)<br>  ) %&gt;%<br>  mutate(trab_home_office = (home_office/mao_de_obra)*100) %&gt;%<br>  drop_na()# gráfico<br>home_edu_cor_ssa &lt;- ggplot(home_edu_cor, aes(fill = Escolaridade, y = trab_home_office, x = Cor)) +<br>  geom_bar(position = "dodge", stat = "identity") +<br>  geom_text(aes(label=sprintf("%1.2f%%",trab_home_office)),size = 3, position =position_dodge(width=0.9),<br>            vjust=-0.5, color = 'black',fontface='bold') +<br>  theme_classic() +<br>  theme(axis.title.x = element_text(colour = "black"),<br>        axis.title.y = element_text(colour = "black"),<br>        axis.text.y = element_text(face="bold", color="#000000", <br>                                   size=10),<br>        axis.line = element_line(colour = "black", <br>                                 size = 1, linetype = "solid"),<br>        axis.text=element_text(size=6, face="bold"),<br>        axis.text.x = element_text(face="bold", color="#000000", size=10),<br>        plot.title = element_text(colour = "black", size = 17, hjust=0.5),<br>        legend.position = "bottom", legend.background = element_rect(fill="ghostwhite", size=0.7, linetype="blank")) +<br>  labs(x = "Cor/Raça", fill = "Escolaridade: ", caption = "Fonte: Microdados da Pnad Covid19 - IBGE. Junho 2020.",<br>       title = "Pessoas em home office, por cor/raça e escolaridade - Salvador/BA ") +<br>  scale_fill_manual(values = c("#00b894","#ff7675","#0984e3","#6c5ce7","#fdcb6e")) +<br>  scale_y_discrete(limits=factor(0:100), breaks = c(0,10,20,30,40,50,60,70,80,90,100), name = "Percentual (%)")# Salvando em PNG<br>ggsave(plot = home_edu_cor_ssa, "home_edu_cor_ssa.png",<br>       width = 14, height = 7, dpi = 150, units = "in",type = "cairo")</pre>



<figure class="wp-block-image"><img src="https://miro.medium.com/max/1890/1*tBsI2DhG3E7SKOoCr4uT-Q.png" alt="Image for post"/></figure>



<p>Podemos ver algumas coisas interessantes com esse gráfico:</p>



<ol><li>Pessoas sem instrução ou com o fundamental incompleto não aparecem em home office ou aparecem com um percentual muito pequeno. Isso pode estar acontecendo pelas condições econômicas dessas pessoas, que não possuem um emprego formal que sustente a condição de fazer um home office ou porque essas pessoas no geral se encontram em algum tipo de trabalho informal. Um outra olhar é de que a pesquisa não conseguiu alcançar essas pessoas, dado que a coleta dos dados ocorreu por meio de entrevista por telefone. Cabe uma análise mais profunda a posteriori.</li><li>Existe um pequeno grupo de pessoas de cor parda e que tem fundamental completo ou médio incompleto que estão em home office. Também existe um pequeno grupo de pessoas de cor preta sem instrução ou com fundamental incompleto que estão em home office.</li><li>O nível de escolaridade é um fator preponderante para estar ou não em home office, isso pode ser notado pela evolução do nível de escolaridade e aumento no percentual de pessoas em home office. Pessoas com pós-graduação tem mais chances de estar trabalhando remotamente do que alguém com apenas o ensino médio.</li></ol>



<p>Vamos ver agora como está a relação Sexo/Idade.</p>



<pre class="wp-block-preformatted">################## Home office - Por Sexo e Idade ################home_sexo_idade &lt;- pnad_com_pesos %&gt;%<br>  group_by(Sexo, Idade) %&gt;%<br>  summarise(<br>    home_office = survey_total(C013 == 1, na.rm = TRUE),<br>    mao_de_obra = survey_total(C001 == 1, na.rm = TRUE)<br>  ) %&gt;%<br>  mutate(trab_home_office = (home_office/mao_de_obra)*100) %&gt;%<br>  drop_na()# gráfico<br>home_sexo_idade_ssa &lt;- ggplot(home_sexo_idade, aes(fill = Idade, y = trab_home_office, x = Sexo)) +<br>  geom_bar(position = "dodge", stat = "identity") +<br>  geom_text(aes(label=sprintf("%1.2f%%",trab_home_office)),size = 3, position =position_dodge(width=0.9),<br>            vjust=-0.5, color = 'black',fontface='bold') +<br>  theme_classic() +<br>  theme(axis.title.x = element_text(colour = "black"),<br>        axis.title.y = element_text(colour = "black"),<br>        axis.text.y = element_text(face="bold", color="#000000", <br>                                   size=10),<br>        axis.line = element_line(colour = "black", <br>                                 size = 1, linetype = "solid"),<br>        axis.text=element_text(size=6, face="bold"),<br>        axis.text.x = element_text(face="bold", color="#000000", size=10),<br>        plot.title = element_text(colour = "black", size = 17, hjust=0.5),<br>        legend.position = "bottom", legend.background = element_rect(fill="ghostwhite", size=0.7, linetype="blank")) +<br>  labs(x = "Sexo", fill = "Faixa Etária: ", caption = "Fonte: Microdados da Pnad Covid19 - IBGE. Junho 2020.",<br>       title = "Pessoas em home office, por sexo e faixa etária - Salvador/BA") +<br>  scale_fill_manual(values = c("#00b894","#ff7675","#0984e3","#6c5ce7","#fdcb6e")) +<br>  scale_y_discrete(limits=factor(0:100), breaks = c(0,10,20,30,40,50,60,70,80,90,100), name = "Percentual (%)")# Salvando em PNG<br>ggsave(plot = home_sexo_idade_ssa, "home_sexo_idade_ssa.png",<br>       width = 10, height = 5, dpi = 120, units = "in",type = "cairo")</pre>



<figure class="wp-block-image"><img src="https://miro.medium.com/max/1080/1*zUdt-Z12sLqyjfULBqoMKA.png" alt="Image for post"/></figure>



<p>Empiricamente é tentador pensar que quanto maior a idade, maior a chance de estar em home office. Talvez porque imagina-se que pessoas com mais idade tenderiam a ocupar cargos mais altos e que estariam aptas a exercer suas funções em casa. Mas não foi isso que os dados mostraram para Salvador. Os valores são muitos semelhantes em todas as faixas. Com exceção no grupo das mulheres, onde 70,32% daquelas com mais de 65 anos estão em home office.</p>



<p>E quanto ao emprego dessas pessoas? Qual vinculo empregatício mantém mais pessoas trabalhando em casa?</p>



<pre class="wp-block-preformatted">################### Home office - Por trabalho ####################home_emprego &lt;- pnad_com_pesos %&gt;%<br>  group_by(Tipo_emprego) %&gt;%<br>  summarise(<br>    home_office = survey_total(C013 == 1, na.rm = TRUE),<br>    mao_de_obra = survey_total(C001 == 1, na.rm = TRUE)) %&gt;%<br>  mutate(trab_home_office = (home_office/mao_de_obra)*100) %&gt;%<br>  drop_na()# ordenando eixo X<br>legenda_trabalhos &lt;- c("Trabalhador doméstico\n (empregado doméstico,\n cuidados, babá)",<br>"Militar", <br>"Policial ou\n Bombeiro",<br>"Setor privado",<br>"Setor público",<br>"Empregador",<br>"Autônomo\n (Conta própria)")# Gráfico<br>home_emprego_ssa &lt;- ggplot(home_emprego, aes(fill = Tipo_emprego, y = trab_home_office, x = Tipo_emprego)) +<br>  geom_bar(position = "dodge", stat = "identity") +<br>  geom_text(aes(label=sprintf("%1.2f%%",trab_home_office)),size = 3, position =position_dodge(width=0.9),<br>            vjust=-0.5, color = 'black',fontface='bold') +<br>  theme_classic() +<br>  theme(axis.title.x = element_text(colour = "black"),<br>        axis.title.y = element_text(colour = "black"),<br>        axis.text.y = element_text(face="bold", color="#000000", <br>                                   size=10),<br>        axis.line = element_line(colour = "black", <br>                                 size = 1, linetype = "solid"),<br>        axis.text=element_text(size=6, face="bold"),<br>        axis.text.x = element_text(face="bold", color="#000000", size=8),<br>        plot.title = element_text(colour = "black", size = 17, hjust=0.5),<br>        legend.position = "none") +<br>  labs(x = "Tipo de Ocupação",<br>       caption = "Fonte: Microdados da Pnad Covid19 - IBGE. Junho 2020.",<br>       title = "Pessoas em home office, por tipo de ocupação - Salvador/BA") +<br>  scale_fill_manual(values = c("#00b894","#ff7675","#0984e3","#6c5ce7","#fdcb6e","#636e72", "#55efc4")) +<br>  scale_x_discrete(labels = legenda_trabalhos) +<br>  scale_y_discrete(limits=factor(0:100), breaks = c(0,10,20,30,40,50,60,70,80,90,100), name = "Percentual (%)")# Salvando em PNG<br>ggsave(plot = home_emprego_ssa, "home_emprego_ssa.png",<br>       width = 10, height = 5, dpi = 120, units = "in",type = "cairo")</pre>



<figure class="wp-block-image"><img src="https://miro.medium.com/max/1080/1*nLpFY3hv-w5M11P6JiWa8Q.png" alt="Image for post"/></figure>



<p>Podemos ver que é no setor público onde mais pessoas estão em home office. Trabalhadores autônomos são os que mais exercem suas atividades fora de casa. Para categorias da segurança pública, militares ou trabalhadores domésticos não foram encontrados resultados na capital baiana.</p>



<p>Como está a distribuição entre cor/raça e salários das pessoas em home office?</p>



<pre class="wp-block-preformatted">############## Home office - Por faixa salarial e cor ##############home_renda &lt;- pnad_com_pesos %&gt;%<br>  group_by(Faixa_salario, Cor) %&gt;%<br>  summarise(<br>    home_office = survey_total(C013 == 1, na.rm = TRUE),<br>    mao_de_obra = survey_total(C001 == 1, na.rm = TRUE)) %&gt;%<br>  mutate(trab_home_office = (home_office / mao_de_obra) * 100) %&gt;%<br>  drop_na()# gráfico<br>home_renda_ssa &lt;- ggplot(home_renda, aes(fill = Faixa_salario, y = trab_home_office, x = Cor)) +<br>  geom_bar(position = "dodge", stat = "identity") +<br>  geom_text(aes(label=sprintf("%1.2f%%",trab_home_office)),size = 2.5, position =position_dodge(width=0.9),<br>            vjust=-0.5, color = 'black',fontface='bold') +<br>  theme_classic() +<br>  theme(axis.title.x = element_text(colour = "black"),<br>        axis.title.y = element_text(colour = "black"),<br>        axis.text.y = element_text(face="bold", color="#000000", <br>                                   size=10),<br>        axis.line = element_line(colour = "black", <br>                                 size = 1, linetype = "solid"),<br>        axis.text=element_text(size=6, face="bold"),<br>        axis.text.x = element_text(face="bold", color="#000000", size=10),<br>        plot.title = element_text(colour = "black", size = 17, hjust=0.5),<br>        legend.position = "bottom", legend.background = element_rect(fill="ghostwhite", size=0.7, linetype="blank")) +<br>  labs(x = "Cor/Raça", fill = "Faixa Salarial:\n(Salários mínimos) ", caption = "Fonte: Microdados da Pnad Covid19 - IBGE. Junho 2020.",<br>       title = "Pessoas em home office, por cor/raça e faixa salarial - Salvador/BA ") +<br>  scale_fill_manual(values = c("#fad390","#e55039","#4a69bd","#60a3bc","#78e08f","#079992")) +<br>  scale_y_discrete(limits=factor(0:100), breaks = c(0,10,20,30,40,50,60,70,80,90,100), name = "Percentual (%)")# Salvando em PNG<br>ggsave(plot = home_renda_ssa, "home_renda_ssa.png",<br>       width = 10, height = 5, dpi = 120, units = "in",type = "cairo")</pre>



<figure class="wp-block-image"><img src="https://miro.medium.com/max/1080/1*aZ3mFJakirQ1WR79NMJYNg.png" alt="Image for post"/></figure>



<p>Podemos observar um percentual alto de pessoas que recebem 4, 5 ou mais salários mínimos em home office. Mas o mais interesse é ver que entre pessoas brancas que recebem menos de um salário mínimo, 23,20% estão mantendo suas atividades em home office. Olhando o mesmo rendimento para pardos e pretos, o percentual encontrado é bem menor, 12,89% e 9,05% respectivamente.</p>



<p>Mas vamos mudar o foco agora. Deixar de olhar apenas trabalhadores em home office e passar a ver como o auxilio emergencial tem sido direcionado; qual o reflexo desse auxilio na população.</p>



<p>Vamos começar olhando quem recebeu o auxilio.</p>



<pre class="wp-block-preformatted">#################### Auxilio - Sexo e Cor #######################<br>auxilio_cor_sexo &lt;- pnad_com_pesos %&gt;%<br>  group_by(Cor, Sexo) %&gt;%<br>  summarise(<br>    auxilio = survey_total(D0051 == 1, na.rm = TRUE),<br>    total = survey_total(one, na.rm = TRUE)<br>  ) %&gt;%<br>  mutate(pessoas_auxilio = (auxilio/total)*100) %&gt;%<br>  drop_na()# gráfico<br>auxilio_cor_sexo_ssa &lt;- ggplot(auxilio_cor_sexo, aes(fill = Cor, y = pessoas_auxilio, x = Sexo)) +<br>  geom_bar(position = "dodge", stat = "identity") +<br>  geom_text(aes(label=sprintf("%1.2f%%",pessoas_auxilio)),size = 3, position =position_dodge(width=0.9),<br>            vjust=-0.5, color = 'black',fontface='bold') +<br>  theme_classic() +<br>  theme(axis.title.x = element_text(colour = "black"),<br>        axis.title.y = element_text(colour = "black"),<br>        axis.text.y = element_text(face="bold", color="#000000", <br>                                   size=10),<br>        axis.line = element_line(colour = "black", <br>                                 size = 1, linetype = "solid"),<br>        axis.text=element_text(size=6, face="bold"),<br>        axis.text.x = element_text(face="bold", color="#000000", size=10),<br>        plot.title = element_text(colour = "black", size = 17, hjust=0.5),<br>        legend.position = "bottom", legend.background = element_rect(fill="ghostwhite", size=0.7, linetype="blank")) +<br>  labs(fill = "Cor: ", x = "Sexo", caption = "Fonte: Microdados da Pnad Covid19 - IBGE. Junho 2020.",<br>       title = "Pessoas que receberam auxílio emergencial, por cor/raça e sexo -\n Salvador/BA") +<br>  scale_fill_manual(values = c("#00b894","#ff7675","#0984e3")) +<br>  scale_y_discrete(limits=factor(0:100), breaks = c(0,10,20,30,40,50,60,70,80,90,100), name = "Percentual (%)")# Salvando em PNG<br>ggsave(plot = auxilio_cor_sexo_ssa, "auxilio_cor_sexo_ssa.png",<br>       width = 10, height = 5, dpi = 120, units = "in",type = "cairo")</pre>



<figure class="wp-block-image"><img src="https://miro.medium.com/max/1080/1*D7JBwu3Z44Scq7UUIjRVxg.png" alt="Image for post"/></figure>



<p>Pardos e Pretos são os grupos que mais receberam o auxilio. Entre os gêneros, os valores são muitos próximos. 50,60% dos homens de cor parda receberam o auxilio, já entre as mulheres de mesma cor, 50,90%. Brancos são o menor grupo em ambos os sexos.</p>



<p>E como anda a renda dessas pessoas que receberam o auxílio?</p>



<pre class="wp-block-preformatted">##################### Auxilio - Faixa Salarial ####################auxilio_renda &lt;- pnad_com_pesos %&gt;%<br>  group_by(Faixa_salario) %&gt;%<br>  summarise(<br>    auxilio = survey_total(D0051 == 1, na.rm = TRUE),<br>    total = survey_total(one, na.rm = TRUE)) %&gt;%<br>  mutate(pessoas_auxilio = (auxilio/total)*100) %&gt;%<br>  drop_na()# gráfico<br>auxilio_renda_ssa &lt;- ggplot(auxilio_renda, aes(fill = Faixa_salario, y = pessoas_auxilio, x = Faixa_salario)) +<br>  geom_bar(position = "dodge", stat = "identity") +<br>  geom_text(aes(label=sprintf("%1.2f%%",pessoas_auxilio)),size = 3, position =position_dodge(width=0.9),<br>            hjust=-0.1, color = 'black',fontface='bold') +<br>  theme_classic() +<br>  coord_flip() +<br>  theme(axis.title.x = element_text(colour = "black"),<br>        axis.title.y = element_text(colour = "black"),<br>        axis.text.y = element_text(face="bold", color="#000000", <br>                                   size=10),<br>        axis.line = element_line(colour = "black", <br>                                 size = 1, linetype = "solid"),<br>        axis.text=element_text(size=6, face="bold"),<br>        axis.text.x = element_text(face="bold", color="#000000", size=10),<br>        plot.title = element_text(colour = "black", size = 17, hjust=0.5),<br>        legend.position = "none") +<br>  labs(x = "Faixa Salarial", caption = "Fonte: Microdados da Pnad Covid19 - IBGE. Junho 2020.",<br>       title = "Pessoas que receberam auxílio emergencial, por renda - Salvador/BA") +<br>  scale_fill_manual(values = c("#00b894","#ff7675","#0984e3","#6c5ce7","#fdcb6e","#636e72")) +<br>  scale_y_discrete(limits=factor(0:100), breaks = c(0,10,20,30,40,50,60,70,80,90,100), name = "Percentual (%)")# Salvando em PNG<br>ggsave(plot = auxilio_renda_ssa, "auxilio_renda_ssa.png",<br>       width = 10, height = 5, dpi = 120, units = "in",type = "cairo")</pre>



<figure class="wp-block-image"><img src="https://miro.medium.com/max/1080/1*ydjQZ8qPyhOPJmhLvrbdhg.png" alt="Image for post"/></figure>



<p>Nota-se que 73,90% das pessoas que viviam com menos de um salário mínimo receberam o auxílio. Dentre aqueles cuja renda permeiam entre 1 e 2 salários, uma parcela expressiva, 45,39%, recebeu o dinheiro. Uma pequena parcela da população, com renda entre 4 e 5, ou mais de 5 salários mínimos também foram contempladas.</p>



<p>Sabemos que o custo de moradia é algo que pesa no orçamento das famílias, por isso considero interessante ver a situação domiciliar daqueles que estão recebendo o auxilio.</p>



<pre class="wp-block-preformatted">################ Auxilio - Por tipo do domicilio ###################auxilio_domicilio &lt;- pnad_com_pesos %&gt;%<br>  group_by(domicilio_situacao) %&gt;%<br>  summarise(<br>    auxilio = survey_total(D0051 == 1, na.rm = TRUE),<br>    total = survey_total(one, na.rm = TRUE)) %&gt;%<br>  mutate(pessoas_auxilio  = (auxilio/total)*100) %&gt;%<br>  drop_na()# ordenando eixo X<br>legenda_domicilio &lt;- c("Próprio (já pago)",<br>                       "Próprio (ainda pagando)",<br>                       "Alugado", <br>                       "Cedido (Por empregador,\n Familiar ou outro)")# gráfico<br>auxilio_domicilio_ssa &lt;- ggplot(auxilio_domicilio, aes(fill = domicilio_situacao, y = pessoas_auxilio, x = domicilio_situacao)) +<br>  geom_bar(position = "dodge", stat = "identity") +<br>  geom_text(aes(label=sprintf("%1.2f%%",pessoas_auxilio)),size = 3, position =position_dodge(width=0.9),<br>            vjust=-0.5, color = 'black',fontface='bold') +<br>  # geom_text(aes(label=paste0(format(round(auxilio,0),<br>  #                            nsmall=0,big.mark=".", decimal.mark=",")," com auxilio")),<br>  #           size = 3,position = position_stack(vjust = .5),<br>  #           vjust=-0.5, color = 'black',fontface='bold') +<br>  # geom_text(aes(label=paste0(format(round(total,0),<br>  #                                   nsmall=0,big.mark=".", decimal.mark=",")," total")),<br>  #           size = 3,position = position_stack(vjust = .3),<br>  #           vjust=-0.5, color = 'black',fontface='bold') +<br> theme_classic() +<br>  theme(axis.title.x = element_text(colour = "black"),<br>        axis.title.y = element_text(colour = "black"),<br>        axis.text.y = element_text(face="bold", color="#000000", <br>                                   size=10),<br>        axis.line = element_line(colour = "black", <br>                                 size = 1, linetype = "solid"),<br>        axis.text=element_text(size=6, face="bold"),<br>        axis.text.x = element_text(face="bold", color="#000000", size=10),<br>        plot.title = element_text(colour = "black", size = 17, hjust=0.5),<br>        legend.position = "none") +<br>  labs(x = "Tipo de domicílio", y ="Percentual (%)",caption = "Fonte: Microdados da Pnad Covid19 - IBGE. Junho 2020.",<br>       title = "Situação do domicílio daqueles que receberam o auxílio emergencial -\n Salvador/BA") +<br>  scale_fill_manual(values = c("#fad390","#e55039","#4a69bd","#60a3bc","#78e08f","#079992")) +<br>  scale_x_discrete(labels = legenda_domicilio) +<br>  scale_y_discrete(limits=factor(0:100), breaks = c(0,10,20,30,40,50,60,70,80,90,100), name = "Percentual (%)")# Salvando em PNG<br>ggsave(plot = auxilio_domicilio_ssa, "auxilio_domicilio_ssa.png",<br>       width = 10, height = 5, dpi = 120, units = "in",type = "cairo")</pre>



<figure class="wp-block-image"><img src="https://miro.medium.com/max/1080/1*7NmmrXBMXM1wlX4nFefofg.png" alt="Image for post"/></figure>



<p>É interessante ver que 48,56% das pessoas com imóvel próprio receberam o auxilio. 65,65% daqueles que de alguma forma vivem em um imóvel cedido também foram beneficiados. 40,75% dos que pagam aluguel foram contemplados, isso significa que dentre os que pagam aluguel, 59,25% não receberam o pagamento do governo.</p>



<hr class="wp-block-separator"/>



<h1 id="ec7d">Considerações Finais</h1>



<p>Todo o script você poderá encontrar no meu&nbsp;<a href="https://github.com/CleitonOERocha/Scripts/blob/master/PNAD_COVID19/PNADCOVID_SSA_v2.R">GitHub</a>. Ademais, muito do que foi apresentado aqui teve como inspiração o trabalho do professor&nbsp;<strong>Regis A. Ely</strong>, da Universidade Federal de Pelotas, o trabalho dele poderá ser encontrado&nbsp;<a href="http://regisely.com/blog/mercado-de-trabalho-covid/">aqui</a>. Agradeço a todos que, porventura, caíram nesse site e acharam o conteúdo interessante.</p>



<p>Aqui estão minhas redes sociais: <a href="https://www.instagram.com/cleiton._r/">Instagram</a>, <a href="https://www.linkedin.com/in/cleitonoerocha/">LinkedIn</a>, <a href="https://github.com/CleitonOERocha"><a href="https://github.com/CleitonOERocha">GitHub</a>.</a> </p>



<p>#R #Rstats #datascience #cienciadedados</p>
<p>O post <a rel="nofollow" href="http://estatidados.com.br/trabalhando-com-os-microdados-da-pnad-covid19-no-r/">Trabalhando com os microdados da PNAD COVID19 no R</a> apareceu primeiro em <a rel="nofollow" href="http://estatidados.com.br">Estatidados</a>.</p>
]]></content:encoded>
					
					<wfw:commentRss>http://estatidados.com.br/trabalhando-com-os-microdados-da-pnad-covid19-no-r/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
	</channel>
</rss>
