<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Arquivos Business Intelligence - Estatidados</title>
	<atom:link href="http://estatidados.com.br/category/business-intelligence/feed/" rel="self" type="application/rss+xml" />
	<link>http://estatidados.com.br/category/business-intelligence/</link>
	<description>Comunidade de Estatística</description>
	<lastBuildDate>Thu, 09 Jun 2022 20:12:41 +0000</lastBuildDate>
	<language>pt-BR</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>
	<item>
		<title>Nova Tendência do Mercado: Carreira de Analista de Dados</title>
		<link>http://estatidados.com.br/nova-tendencia-do-mercado-carreira-de-analista-de-dados/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=nova-tendencia-do-mercado-carreira-de-analista-de-dados</link>
		
		<dc:creator><![CDATA[admin]]></dc:creator>
		<pubDate>Fri, 04 Mar 2022 15:38:33 +0000</pubDate>
				<category><![CDATA[Business Intelligence]]></category>
		<category><![CDATA[ciencia de dados]]></category>
		<category><![CDATA[Inteligência de negócios]]></category>
		<guid isPermaLink="false">http://estatidados.com.br/?p=690</guid>

					<description><![CDATA[<p>Por: José Bezerra da Silva Filho, Thiago Marques Imagine uma situação na qual as empresas correm atrás de você, e não o contrário. Isso já é realidade para os profissionais da&#160;área de análise de dados. O&#160;Bureau of Labor and Statistics&#160;dos<a class="leiamais" href="http://estatidados.com.br/nova-tendencia-do-mercado-carreira-de-analista-de-dados/" title="Nova Tendência do Mercado: Carreira de Analista de Dados">...[Continuar lendo]</a></p>
<p>O post <a href="http://estatidados.com.br/nova-tendencia-do-mercado-carreira-de-analista-de-dados/">Nova Tendência do Mercado: Carreira de Analista de Dados</a> apareceu primeiro em <a href="http://estatidados.com.br">Estatidados</a>.</p>
]]></description>
										<content:encoded><![CDATA[
<p>Por: <strong>José Bezerra da Silva Filho</strong>, <strong>Thiago Marques</strong></p>



<p>Imagine uma situação na qual as empresas correm atrás de você, e não o contrário.</p>



<p>Isso já é realidade para os profissionais da&nbsp;<strong>área de análise de dados</strong>.</p>



<p>O&nbsp;<em>Bureau of Labor and Statistics</em>&nbsp;dos EUA (<a href="http://www.bls.gov/">www.bls.gov</a>)&nbsp;projeta que<strong>, até 2028, haverá um aumento de 72% nas novas carreiras relacionadas à Análise de Dados</strong>.&nbsp;</p>



<p>Isso implica que muitas empresas estão à procura de&nbsp;<strong>analistas de dados&nbsp;</strong>profissionais para integrar as suas equipes. É, portanto, de grande importância que os analistas de dados aprimorem suas habilidades e se tornem competitivos se quiserem estar entre as pessoas mais procuradas para empregos na área de&nbsp;<strong>Análise de Dados</strong>.</p>



<p>Ter a experiência certa e as habilidades exigidas para um&nbsp;<strong>analista de dados</strong>&nbsp;atraem salários de seis dígitos,&nbsp;<strong>mais de 100 mil por ano</strong>, de acordo com a&nbsp;<em>Robert Half Technology</em>, Recrutamento Especializado e Projetos em Tecnologia (<a href="http://www.roberthalf.com.br/">www.roberthalf.com.br</a>).</p>



<p>Com um excelente salário&nbsp;<strong>você consegue ajudar a sua família,&nbsp;</strong>além de poder realizar os sonhos de ter&nbsp;<strong>o seu carro</strong>,&nbsp;<strong>a sua casa</strong>&nbsp;e poder&nbsp;<strong>viajar pelo Brasil e pelo mundo</strong>.</p>



<p><strong>Principais áreas de melhoria para uma carreira de desenvolvedor em análise de dados</strong></p>



<p>Trabalhar para melhorar suas habilidades de análise de dados abrirá portas para novas oportunidades e melhores compensações.</p>



<p>As habilidades essenciais que os&nbsp;<strong>analistas de dados</strong>&nbsp;precisam melhorar para conseguir um emprego dos sonhos incluem o conhecimento de muitas tecnologias. Tentaremos resumir as mais significativas nesta seção.</p>



<p><strong>R</strong>&nbsp;e&nbsp;<strong>Python</strong>&nbsp;são mais adequados para lidar com um grande conjunto de dados. No entanto, métodos avançados do Excel, como Macros, são usados para conjuntos de dados menores e análises rápidas.</p>



<p>Os analistas de dados que trabalham em&nbsp;<em>startups</em>&nbsp;ou pequenas e médias empresas utilizam bancos de dados Excel; portanto, é uma ferramenta obrigatória para todos os iniciantes em analistas de dados. À medida que progride, você encontrará grandes conjuntos de dados e, portanto, também exigirá que você aprenda a linguagem de programação estatística à medida que avança em sua carreira.</p>



<p><strong>SQL</strong></p>



<p><strong>SQL (sigla em inglês para&nbsp;</strong><strong><em>Standard Query Language</em></strong><strong>):</strong>&nbsp;significa Linguagem de Consulta Estruturada. É a linguagem de banco de dados padrão do setor e uma habilidade importante para todos os analistas de dados. SQL permite interagir com grandes conjuntos de dados estruturados que precisam ser armazenados em<strong>&nbsp;bancos de dados relacionais</strong>.</p>



<p>Como analista de dados, você precisa estar familiarizado com SQL e armazenar, gerenciar e relacionar com eficiência vários conjuntos de dados. Ter uma boa compreensão das fontes de dados será útil em sua carreira, e o SQL lhe dá a capacidade de navegar por grandes bancos de dados e trabalhar em projetos exigentes.</p>



<p><strong>Habilidades Técnicas do Analista de Dados</strong></p>



<p><strong>Analistas de Dados</strong>&nbsp;devem possuir as habilidades técnicas corretas, além de serem proficientes no uso de diferentes ferramentas de banco de dados usadas na análise de dados. Eles também devem estar familiarizados com programas de computador, habilidades de codificação, usando SQL, JavaScript,&nbsp;<strong>Python, R</strong>, XML , Hadoop, SAS e outros programas de aprendizado de máquina.</p>



<p><strong>Programação Estatística em Python</strong></p>



<p>É uma das linguagens de programação usadas na análise de dados. Você precisa entender conceitos como&nbsp;<strong>coleta de dados</strong>,&nbsp;<strong><em>web scraping</em></strong>&nbsp;e o uso de&nbsp;<strong>Python</strong>&nbsp;para&nbsp;<strong>desenvolver aplicativos da web</strong>. Python é uma poderosa linguagem de programação estatística que realiza análises avançadas e análises preditivas em grandes conjuntos de dados. Portanto, todo&nbsp;<strong>analista de dados</strong>&nbsp;deve melhorar sua habilidade em linguagens de programação&nbsp;<strong>Python&nbsp;</strong>ou&nbsp;<strong>R</strong>.&nbsp;<strong>R</strong>&nbsp;é ideal para explorar vários conjuntos de dados e fazer análises&nbsp;<em>ad-hoc</em>.</p>



<p><strong>Quais são as carreiras de analista de dados?</strong></p>



<p>Existem várias carreiras em análise de dados. Elas incluem:</p>



<ul class="wp-block-list"><li><strong>Engenheiro de&nbsp;</strong><strong><em>big data</em></strong><strong>:</strong>&nbsp;engenheiros de&nbsp;<em>big data</em>&nbsp;transformam grandes volumes de dados em&nbsp;<em>insights</em>&nbsp;úteis que os gerentes podem usar para informar sua tomada de decisão. Eles são necessários para recuperar, coletar, interpretar, analisar e relatar dados de negócios. Eles também criam software e processos com os quais outras partes interessadas podem trabalhar para processar dados.</li><li><strong>Analista de&nbsp;</strong><strong><em>Business Intelligence</em></strong>: analisa os dados da empresa para obter&nbsp;<em>insights</em>&nbsp;que podem ser adotados pelos executivos para tomar decisões bem informadas. Eles examinam dados e&nbsp;<strong>identificam padrões e tendências</strong>.&nbsp;</li><li><strong>Arquiteto de dados</strong>: arquitetos de dados são responsáveis por projetar a estrutura de dados complexas.&nbsp;</li><li><strong>Gerente de&nbsp;</strong><strong><em>data warehouse</em></strong><strong>:&nbsp;</strong>eles são responsáveis por armazenar e analisar dados em suas respectivas organizações. Eles usam métricas de desempenho e uso para avaliar e analisar a carga de dados. Além disso, eles identificam os riscos potenciais enfrentados pela transferência ou armazenamento de dados e apresentam formas de&nbsp;<em>mitigar&nbsp;</em>esses riscos.</li><li><strong>Cientista de dados:&nbsp;</strong>eles projetam novas formas de mineração de dados, modelagem e desenvolvem protótipos, algoritmos e modelos preditivos. Ele precisa ser qualificado em análise de regressão, diferentes técnicas de mineração de dados, árvores de decisão e análise.</li><li><strong>Gerenciador de banco de dados:&nbsp;</strong>o gerenciador de banco de dados é obrigado a identificar quaisquer problemas que os bancos de dados possam ter e tomar medidas corretivas para resolvê-los. Eles ajudam a projetar e implementar a manutenção de armazenamento trabalhando em conjunto com desenvolvedores de banco de dados.</li><li><strong>Modelador de dados:&nbsp;</strong>os modeladores de dados usam suas habilidades para criar relatórios sobre tendências micro e macro dos dados. Eles têm habilidades em ciência da informação, programação e análise estatística. Suas descobertas sobre tendências de dados os fazem ajudar as organizações a tomar decisões.</li><li><strong>Desenvolvedores de banco de dados:&nbsp;</strong>esses profissionais analisam principalmente os processos de banco de dados e agilizam ou eliminam aqueles que são ineficientes. Eles também fazem análise de dados e testes de unidade trabalhando em colaboração com outros profissionais de dados.</li></ul>



<p><strong>Quais novas carreiras de analista de dados você deve considerar?</strong></p>



<p>As novas&nbsp;<strong>carreiras de analista de dados&nbsp;</strong>nas quais os desenvolvedores podem se especializar são:</p>



<ul class="wp-block-list"><li><strong>Analista quantitativo</strong>: o analista quantitativo é uma carreira altamente comercializável em empresas financeiras. Os analistas quantitativos usam a análise de dados para identificar potenciais oportunidades de investimento financeiro e gerenciar os riscos que podem surgir a partir disso.</li><li><strong>Analista de dados de saúde</strong>: são os novos profissionais em análise de dados aplicados na área de saúde. O analista de dados de saúde ajuda a melhorar a qualidade de vida das pessoas, auxiliando os médicos com soluções para os desafios que eles encontram.&nbsp;</li><li><strong>Consultor de análise de dados</strong>: as funções de um consultor de análise de dados são fornecer&nbsp;<em>insights</em>&nbsp;que a empresa pode adotar em suas operações. Eles se especializam em uma área-chave de pesquisa e trabalham com diferentes organizações.&nbsp;</li><li><strong>Especialista em logística de transporte</strong>: esses especialistas precisam de experiência em análise de dados para desempenhar suas funções. Sua experiência é necessária em empresas que transportam ou enviam mercadorias físicas com frequência, como a Amazon. Eles são obrigados a identificar as melhores rotas e meios eficientes de transporte das mercadorias.&nbsp;</li></ul>



<p><strong>Existem muitas oportunidades de análise de dados em todo o mundo</strong>, por isso os analistas de dados precisam aprimorar suas habilidades.</p>



<p><strong>Considerações Finais</strong></p>



<p>A&nbsp;<strong>análise de dados&nbsp;</strong>é um campo de rápido crescimento que oferece aos profissionais a oportunidade de adquirir habilidades e contribuir com mudanças positivas em muitas organizações ao redor do mundo. Se você está ansioso para iniciar ou crescer sua carreira em análise de dados, a melhor opção é fazer o treinamento&nbsp;<a href="https://bsbr.com.br/courses/mba-em-data-science-e-statistics-com-python/"><strong>MBA em Data Science e Statistics com Python</strong></a>, do&nbsp;<a href="https://bsbr.com.br/">Instituto de Capacitação Business School Brasil</a>&nbsp;–&nbsp;<a href="https://bsbr.com.br/">BSBr</a>.com.br.&nbsp;</p>



<p>Neste MBA iremos lhe dar os seguintes Bônus:</p>



<p><img src="https://s.w.org/images/core/emoji/17.0.2/72x72/1f4cc.png" alt="📌" class="wp-smiley" style="height: 1em; max-height: 1em;" />&nbsp;<strong>Networking</strong>&nbsp;&#8211; Conseguir uma rede de contatos e fazer novos amigos;</p>



<p><img src="https://s.w.org/images/core/emoji/17.0.2/72x72/1f4cc.png" alt="📌" class="wp-smiley" style="height: 1em; max-height: 1em;" />&nbsp;<strong>Crescimento profissional</strong>&nbsp;&#8211; emprego em vários cargos, além de poder subir de cargo até conquistar a gerência, por exemplo;</p>



<p><img src="https://s.w.org/images/core/emoji/17.0.2/72x72/1f4cc.png" alt="📌" class="wp-smiley" style="height: 1em; max-height: 1em;" />&nbsp;<strong>Currículo relevante</strong>&nbsp;&#8211; você valoriza seu currículo na hora de entrar para o mercado;</p>



<p><img src="https://s.w.org/images/core/emoji/17.0.2/72x72/1f4cc.png" alt="📌" class="wp-smiley" style="height: 1em; max-height: 1em;" />&nbsp;<strong>Maior flexibilidade</strong>&nbsp;&#8211; possibilidade de trabalho remoto, no Brasil e no exterior.</p>



<p><strong>Autores</strong></p>



<p><strong>Prof. Dr. José Bezerra da Silva Filho</strong>&nbsp;é entusiasta em Gerenciamento de Projetos, Doutor em Engenharia pela Universidade Federal de Campina Grande – UFCG e&nbsp;<em>University of Maryland at College Park</em>&nbsp;(EUA) e Mestre em Ciência da Computação pela UFCG. Elaborou, implantou e coordenou um curso de Mestrado em Informática Aplicada. Bezerra já coordenou dezenas de turmas de cursos de MBA/Especialização. Trabalhou no Banco do Nordeste do Brasil &#8211; BNB por mais de três décadas. É autor de dez livros, dentre os quais: Tecnologia da Informação e Comunicação para Gestores; Na Trilha dos Lucros: Prática de Gestão para Tornar sua Empresa mais lucrativa, e O Guia Definitivo do Gerenciamento Ágil de Projetos: O Segredo da Hiperprodutividade,&nbsp;<a href="https://josebezerraoficial.com.br/curriculo-magnetico-carta">COMO FAZER UM CURRÍCULO PROFISSIONAL MAGNÉTICO: O Segredo para você ser chamado para entrevista de emprego de imediato</a>. Atualmente Bezerra coordena o&nbsp;<a href="https://bsbr.com.br/courses/mba-em-gerencia-de-projetos-fortaleza/">MBA em Gerenciamento de Projetos</a>&nbsp;do&nbsp;<a href="https://bsbr.com.br/">Instituto de Capacitação Business School Brasil – BSBr</a>&nbsp;e o&nbsp;<a href="https://bsbr.com.br/courses/curso-pmp-capm-em-fortaleza/">Treinamento de Preparação para as Certificações PMP e CAPM</a>, que já está na sua 48ª Turma.</p>



<p><strong>Contatos do Autor:</strong></p>



<p>● &nbsp;(85) 9.9921-1675</p>



<p>● &nbsp;E-mail: Professor.Dr.Bezerra@bsbr.com.br</p>



<p><strong>Thiago Marques&nbsp; é&nbsp;</strong>Estatístico pela federal do IBGE, a ENCE (Escola Nacional de Ciências Estatísticas), entusiasta na disseminação da Estatística e possui larga experiência na atuação em Estatística no mercado, tendo passado por grandes centros universitários, multinacionais de consultoria, pelo IBRE/FGV (Instituto Brasileiro de Economia) e pelo IBGE (Instituto Brasileiro de Geografia e Estatística), foi professor da pós de ciências de dados do SENAC RJ e da UNISUAM e é o criador do maior canal de Estatística, Ciência de dados da America Latina! O chamado EstaTiDados :). Atualmente é Consultor em Análise Estatística no IBGE, professor na sua Comunidade de Estatística, na Casa da Pesquisa Operacional (CPO), professor da MBA em Ciência de dados da UNIFOR, professor na MBA em Ciência de dados da Farias Brito, professor no MBA Executivo em Data Science para negócios (TREVISAN), professor convidado na MBA em BI, Marketing Digital e Estratégia Data Driven da PUC RS e Professor da MBA em Data Science e Analytics da USP e Coordenador do MBA em Data Science e Analytics e Estatística e o MBA de Marketing Analytics e Estatística no&nbsp;<a href="https://bsbr.com.br/">Instituto de Capacitação Business School Brasil – BSBr</a>, realiza palestras e treinamentos para capacitação em Estatística, Pesquisa Operacional, R e Ciência de Dados.</p>
<p>O post <a href="http://estatidados.com.br/nova-tendencia-do-mercado-carreira-de-analista-de-dados/">Nova Tendência do Mercado: Carreira de Analista de Dados</a> apareceu primeiro em <a href="http://estatidados.com.br">Estatidados</a>.</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>Clusterizando os clientes de uma loja de shopping utilizando o algoritmo K-Means</title>
		<link>http://estatidados.com.br/clusterizando-os-clientes-de-uma-loja-de-shopping-utilizando-o-algoritmo-k-means/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=clusterizando-os-clientes-de-uma-loja-de-shopping-utilizando-o-algoritmo-k-means</link>
					<comments>http://estatidados.com.br/clusterizando-os-clientes-de-uma-loja-de-shopping-utilizando-o-algoritmo-k-means/#respond</comments>
		
		<dc:creator><![CDATA[admin]]></dc:creator>
		<pubDate>Tue, 22 Jun 2021 15:36:58 +0000</pubDate>
				<category><![CDATA[Business Intelligence]]></category>
		<category><![CDATA[ciencia de dados]]></category>
		<category><![CDATA[Hernandes Matias Junior]]></category>
		<guid isPermaLink="false">http://estatidados.com.br/?p=617</guid>

					<description><![CDATA[<p>Neste trabalho, o script foi desenvolvido em linguagem R na IDE do RStudio Suponha que uma empresa deseja desenvolver campanhas de marketing junto aos seus clientes para alavancar seu faturamento. Essa é uma situação muito comum nas organizações, mas o<a class="leiamais" href="http://estatidados.com.br/clusterizando-os-clientes-de-uma-loja-de-shopping-utilizando-o-algoritmo-k-means/" title="Clusterizando os clientes de uma loja de shopping utilizando o algoritmo K-Means">...[Continuar lendo]</a></p>
<p>O post <a href="http://estatidados.com.br/clusterizando-os-clientes-de-uma-loja-de-shopping-utilizando-o-algoritmo-k-means/">Clusterizando os clientes de uma loja de shopping utilizando o algoritmo K-Means</a> apareceu primeiro em <a href="http://estatidados.com.br">Estatidados</a>.</p>
]]></description>
										<content:encoded><![CDATA[
<h4 class="wp-block-heading"><span style="color:#8b9093" class="has-inline-color">Neste trabalho, o script foi desenvolvido em linguagem R na IDE do RStudio</span></h4>



<figure class="wp-block-image"><img decoding="async" src="https://miro.medium.com/max/2800/1*AFZ2thnOUF1u904h4QkiBA.gif" alt=""/><figcaption>Ilustração por Jiaqi Wang.</figcaption></figure>



<p>Suponha que uma empresa deseja desenvolver campanhas de marketing junto aos seus clientes para alavancar seu faturamento. Essa é uma situação muito comum nas organizações, mas o sucesso de uma campanha está diretamente ligado ao direcionamento correto para um público alvo.</p>



<p>Neste trabalho desenvolvido em R e utilizando o algoritmo de Machine Learning K-Means, traço os perfis de clientes que uma loja de shopping possui, para que ela possa realizar ações de marketing que façam sentido para cada um de seus públicos.</p>



<h1 class="wp-block-heading" id="f6a9">1. Carregando as bibliotecas</h1>



<p>Sem muito segredo, carregamos as bibliotecas comumente utilizadas nesse tipo de trabalho de clusterização não hierárquico. No código abaixo, cada linha é seguida de um comentário explicando ao que ela se refere.</p>



<pre class="wp-block-preformatted">library(tidyverse)  # pacote para manipulação de dados<br>library(cluster)    # algoritmo de cluster<br>library(factoextra) # algoritmo de cluster e visualização<br>library(fpc)        # algoritmo de cluster e visualização<br>library(gridExtra)  # para a funcao grid arrange<br>library(readxl)     # leitura dos dados</pre>



<h1 class="wp-block-heading" id="c924">2. Importando os dados</h1>



<p>Com as bibliotecas carregadas, importamos a base de dados “clientes” e a visualizei, verificando o número de variáveis e de observações.</p>



<figure class="wp-block-image"><img decoding="async" src="https://miro.medium.com/max/1372/1*q6VlnBWTMtQZzE1KJKITWQ.png" alt=""/></figure>



<p>Esse dataframe possui uma coluna “CustomerID” e as variáveis “Gender”, “Age”, “Annual Income” e “Spending Score”.</p>



<p>Mantivemos no dataframe apenas as colunas que iremos utilizar para o agrupamento, que serão “Annual Income” e “Spending Score”. Como o foco é definir perfis de consumo, não utilizaremos dados de gênero e idade. Ambas as colunas mantidas foram renomeadas para a tradução em português, para que ficasse mais intuitiva a visualização nos gráficos.</p>



<pre class="wp-block-preformatted">clientes &lt;- read.table('Mall_Customers.csv',sep = ",", header = T, dec = ",")<br>rownames(clientes) &lt;- clientes[,1]<br>clientes &lt;- clientes[,-c(1,2,3)]clientes &lt;- clientes %&gt;% rename(salario.anual=Annual.Income..k..,<br>                    score=Spending.Score..1.100.<br>                    )clientes.padronizado &lt;- scale(clientes)</pre>



<p>Repare que na última linha do bloco anterior eu criei um novo dataframe “clientes.padronizado”, que recebe os dados de “clientes”, mas já com os dados convertidos em uma mesma escala.</p>



<h1 class="wp-block-heading" id="8d4e">3. Verificando o número de clusters e agrupando a base de dados</h1>



<p>Na clusterização, um grande objetivo é manter a menor variância dentro dos grupos, os deixando mais homogêneos. Para definir o número de clusters a serem considerados, utilizando o “Elbow Method”, plotando os dados em um gráfico de linhas, onde no eixo X estão o número de clusters e no eixo Y, o somatório das variâncias.</p>



<pre class="wp-block-preformatted">fviz_nbclust(clientes.padronizado, FUN = hcut, method = "wss")</pre>



<figure class="wp-block-image"><img decoding="async" src="https://miro.medium.com/max/990/1*1bZfgcjlQPr-ug5y6PItHA.png" alt=""/></figure>



<p>Repare que quanto mais eu aumento o número de clusters, mais eu diminuo a variância dentro deles. No entanto, após o número 5 a queda é menos acentuada, o que demonstra que&nbsp;<strong>a partir dali eu estou dividindo em grupos diferentes clientes que possuem perfis parecidos</strong>.</p>



<p>Em tradução, o “Elbow Method” significa “Método do Cotovelo”, pois consideramos o número de clusters aquele que aparece bem na volta da curva, como um cotovelo mesmo. Nesse caso, inicialmente o 5 parece ser o número ideal a ser utilizado.</p>



<p>Mas para fins de estudos, vamos testar os dados com clusters que vão de 3 a 6, e plotaremos em um gráfico para conseguirmos visualizar melhor a divisão.</p>



<pre class="wp-block-preformatted">clientes.k3 &lt;- kmeans(clientes.padronizado,centers=3)<br>clientes.k4 &lt;- kmeans(clientes.padronizado,centers=4)<br>clientes.k5 &lt;- kmeans(clientes.padronizado,centers=5)<br>clientes.k6 &lt;- kmeans(clientes.padronizado,centers=6)</pre>



<p>Com meus dados divididos em clusters de 3 a 6, criamos os gráficos e logo em seguida utilizamos a função “grid.arrange” para visualizarmos e compararmos todos lado a lado.</p>



<pre class="wp-block-preformatted">G1 &lt;- fviz_cluster(clientes.k3, geom="point", data=clientes.padronizado) + ggtitle("k=3")G2 &lt;- fviz_cluster(clientes.k4, geom="point", data=clientes.padronizado) + ggtitle("k=4")G3 &lt;- fviz_cluster(clientes.k5, geom="point", data=clientes.padronizado) + ggtitle("k=5")G4 &lt;- fviz_cluster(clientes.k6, geom="point", data=clientes.padronizado) + ggtitle("k=6")grid.arrange(G1,G2,G3,G4, nrow=2)</pre>



<figure class="wp-block-image"><img decoding="async" src="https://miro.medium.com/max/3072/1*fD4oAziYv_BabyYJwMIS9w.png" alt=""/></figure>



<p>Perceba como os dados que foram divididos em 3 e 4 clusters possuem grupos grandes, com clientes diferentes que claramente elevam a variância dentro de cada um deles. Já nos dados que foram divididos em 5 e 6 clusters os grupos estão abrangendo clientes que são parecidos entre si, em uma delimitação que faz mais sentido.</p>



<p>Aqui, seria possível utilizar 5 ou 6 clusters. No entanto, como verificamos com o “Elbow Method” que o somatório das variâncias de 5 para 6 cai muito pouco,&nbsp;<strong>escolhemos então utilizar 5 clusters</strong>.</p>



<h1 class="wp-block-heading" id="7f91">4. Juntando os dados</h1>



<p>Após decidir utilizar o agrupamento do “clientes.k5”, importamos novamente a base de dados inicial e concatenamos, criando&nbsp;<strong>uma nova coluna que se refere a qual grupo aquele cliente pertence</strong>.</p>



<pre class="wp-block-preformatted">clientes2 &lt;- read.table('Mall_Customers.csv',sep = ",", header = T, dec = ",")<br>clientesfit &lt;- data.frame(clientes.k5$cluster)clientes.final &lt;- cbind(clientes2,clientesfit)</pre>



<figure class="wp-block-image"><img decoding="async" src="https://miro.medium.com/max/839/1*vVMJbjB65b7tbJr33JZUOw.png" alt=""/></figure>



<h1 class="wp-block-heading" id="80c6">5. Análise descritiva dos grupos</h1>



<p>Definido qual o grupo de cada cliente, podemos agora realizar uma análise descritiva dos grupos, para saber qual a média de salário anual e qual a média de consumo de cada um deles.</p>



<pre class="wp-block-preformatted">mediagrupo &lt;- clientes.final %&gt;% <br>  group_by(clientes.k5.cluster) %&gt;% <br>  summarise(n=n(),<br>            salario.anual=mean(Annual.Income..k..),<br>            score=mean(Spending.Score..1.100.)<br>            )<br>mediagrupo</pre>



<figure class="wp-block-image"><img decoding="async" src="https://miro.medium.com/max/475/1*yx5IcUpFuaPpJnMllg2xlg.png" alt=""/></figure>



<p>Como interpretamos os dados:</p>



<ul class="wp-block-list"><li><strong>Grupo 1</strong>: Ganha pouco e gasta muito;</li><li><strong>Grupo 2</strong>: Ganha muito e gasta muito;</li><li><strong>Grupo 3</strong>: Ganha muito e gasta pouco;</li><li><strong>Grupo 4</strong>: Ganha pouco e gasta pouco;</li><li><strong>Grupo 5</strong>: Ganho intermediário e gasto também intermediário.</li></ul>



<h1 class="wp-block-heading" id="bd74">6. Salvando a nova base de dados com a coluna de cluster</h1>



<p>Após interpretar os dados e verificar com a área de negócio se eles fazem sentido, exportamos a nova base de dados em um arquivo .csv.</p>



<pre class="wp-block-preformatted">write.csv(clientes.final,file = "clientesfinal.csv")</pre>



<p>Gostou do post? O código e as bases de dados estão no&nbsp;<a href="https://github.com/hernandesmjunior/r_machine_learning/tree/main/Clusteriza%C3%A7%C3%A3o/Clientes%20de%20um%20Shopping"><strong>meu Github</strong></a>. Dúvidas e sugestões, é só me mandar mensagem&nbsp;<a href="https://www.linkedin.com/in/hernandesmjunior/"><strong>pelo Linkedin</strong></a>&nbsp;<img src="https://s.w.org/images/core/emoji/17.0.2/72x72/1f600.png" alt="😀" class="wp-smiley" style="height: 1em; max-height: 1em;" /></p>



<p>Link do post original: <a href="https://medium.com/jogandoosdados/clusterizando-os-clientes-de-uma-loja-de-shopping-utilizando-o-algoritmo-kmeans-91cf5b330204">https://medium.com/jogandoosdados/clusterizando-os-clientes-de-uma-loja-de-shopping-utilizando-o-algoritmo-kmeans-91cf5b330204</a></p>



<p>LinkedIn do autor: <a href="https://www.linkedin.com/in/hernandesmjunior/">https://www.linkedin.com/in/hernandesmjunior/</a></p>



<p>#analisedecluster #clusterizacao #aprendizadonaosupervisionado</p>
<p>O post <a href="http://estatidados.com.br/clusterizando-os-clientes-de-uma-loja-de-shopping-utilizando-o-algoritmo-k-means/">Clusterizando os clientes de uma loja de shopping utilizando o algoritmo K-Means</a> apareceu primeiro em <a href="http://estatidados.com.br">Estatidados</a>.</p>
]]></content:encoded>
					
					<wfw:commentRss>http://estatidados.com.br/clusterizando-os-clientes-de-uma-loja-de-shopping-utilizando-o-algoritmo-k-means/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
		<item>
		<title>Censo Escolar 2019</title>
		<link>http://estatidados.com.br/censo-escolar-2019/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=censo-escolar-2019</link>
					<comments>http://estatidados.com.br/censo-escolar-2019/#respond</comments>
		
		<dc:creator><![CDATA[admin]]></dc:creator>
		<pubDate>Tue, 25 Aug 2020 17:25:47 +0000</pubDate>
				<category><![CDATA[Alex Souza]]></category>
		<category><![CDATA[Business Intelligence]]></category>
		<guid isPermaLink="false">http://estatidados.com.br/?p=354</guid>

					<description><![CDATA[<p>No dia 19/03/2020 o&#160;INEP(Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira) disponibilizou o Censo Escolar da Educação Básica de 2019, com dados de todas as Escolas do Brasil, seja Estadual, Federal, Municipal, Particular&#8230; Com base nesses dados, fiz uma<a class="leiamais" href="http://estatidados.com.br/censo-escolar-2019/" title="Censo Escolar 2019">...[Continuar lendo]</a></p>
<p>O post <a href="http://estatidados.com.br/censo-escolar-2019/">Censo Escolar 2019</a> apareceu primeiro em <a href="http://estatidados.com.br">Estatidados</a>.</p>
]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-image"><img decoding="async" src="https://media-exp1.licdn.com/dms/image/C4E12AQH5yHAomB8DQg/article-cover_image-shrink_423_752/0?e=1603929600&amp;v=beta&amp;t=GM4J-EOxuZdZHVl0SJ5UZo5Xx40hfAcvHXkz-Upn1io" alt=""/></figure>



<p>No dia 19/03/2020 o&nbsp;<a href="http://www.inep.gov.br/" target="_blank" rel="noreferrer noopener"><strong>INEP</strong></a>(Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira) disponibilizou o Censo Escolar da Educação Básica de 2019, com dados de todas as Escolas do Brasil, seja Estadual, Federal, Municipal, Particular&#8230; Com base nesses dados, fiz uma análise utilizando&nbsp;<a href="https://blogdozouza.wordpress.com/bi-3/" target="_blank" rel="noreferrer noopener"><strong><em>Business Intelligence</em></strong></a><strong></strong>e estou disponibilizando com o objetivo de ajudar de alguma forma Pais e Responsáveis por Aluno, Alunos, Profissionais da Educação e etc&#8230; Mais informações sobre B<em>usiness Intelligence</em>&nbsp;na área da Educação,&nbsp;<a href="https://blogdozouza.wordpress.com/2015/12/15/business-intelligence-na-educacao/" target="_blank" rel="noreferrer noopener">confiram esse post</a>.</p>



<p>A ferramenta de visualização utilizada foi o<strong>&nbsp;Microsoft Power BI</strong>.</p>



<h2 class="wp-block-heading">Contextualizando</h2>



<p><strong>Censo Escolar</strong>&nbsp;é um levantamento de dados estatístico-educacionais de âmbito nacional realizado anualmente. Com ele, o INEP verifica desde o número de matrículas e rendimento dos alunos até a infraestrutura das escolas e funções docentes. Os dados são fornecidos pelas próprias escolas, públicas e privadas, e redes de ensino estaduais e municipais.</p>



<h2 class="wp-block-heading">Explicando algumas das funcionalidades dos&nbsp;<em>Dashboards</em></h2>



<p>A tela inicial, contendo botões para os Reports (<strong>Consultar Censo Escolar 2019</strong>,&nbsp;<strong>Consultar Alunos por Região</strong>&nbsp;e&nbsp;<strong>Perfil Alunos do Ceará (Privadas)</strong>)</p>



<figure class="wp-block-image"><a href="http://bit.ly/2VxoBzb" target="_blank" rel="noreferrer noopener"><img decoding="async" src="https://media-exp1.licdn.com/dms/image/C4E12AQE-CkNL45hdyw/article-inline_image-shrink_1000_1488/0?e=1603929600&amp;v=beta&amp;t=51ErrdStkDXkHg5MD3npWZMJIxQZXybn5WLjUcPZFu0" alt="Não foi fornecido texto alternativo para esta imagem"/></a></figure>



<h3 class="wp-block-heading">Clicando no Botão:&nbsp;Consultar Censo Escolar 2019, vamos para a seguinte tela:</h3>



<figure class="wp-block-image"><a href="http://bit.ly/2VxoBzb" target="_blank" rel="noreferrer noopener"><img decoding="async" src="https://media-exp1.licdn.com/dms/image/C4E12AQE22sib-606SQ/article-inline_image-shrink_1000_1488/0?e=1603929600&amp;v=beta&amp;t=cJklTqdFLP4ElFG835McVk5qOSNQPi5Liaf4JRxEXko" alt="Não foi fornecido texto alternativo para esta imagem"/></a></figure>



<ul class="wp-block-list"><li>Nessa tela acima, poderá filtrar pelo código INEP, por Estado, Município, Tipo de Escola e Funcionamento;</li><li>Além desses filtros, foi criado um Filtro por&nbsp;<strong>nome da Escola</strong>&nbsp;que permite filtrar por nome ou parte do nome da Escola;</li><li>Tela é totalmente iterativa e muda com base nos filtros utilizados;</li><li>No Código do&nbsp;<strong>INEP</strong>, tem um&nbsp;<strong><u>Link</u></strong>&nbsp;para detalhar informações da Escola (por exemplo, se tem biblioteca, auditório, refeição, indígena, acesso para PCD, EJA e etc);</li><li>No nome da&nbsp;<strong>ESCOLA</strong>, se colocar o mouse em cima, aparecerá alguns detalhes sobre a Escola, como mostra a imagem abaixo (Região, Estado, Município, Localização)</li></ul>



<figure class="wp-block-image"><a href="http://bit.ly/2VxoBzb" target="_blank" rel="noreferrer noopener"><img decoding="async" src="https://media-exp1.licdn.com/dms/image/C4E12AQEBwRGLzYuM3Q/article-inline_image-shrink_1000_1488/0?e=1603929600&amp;v=beta&amp;t=lwc7sIWbGEAGvIvDUIH9RHaIXcq7M9IUIJ6FEZRs3kw" alt="Não foi fornecido texto alternativo para esta imagem"/></a></figure>



<p>No&nbsp;<strong>Gráfico</strong>, se clicarmos nas duas setas pra baixo, ele detalha por Estados e Municípios (como vemos na imagem abaixo por exemplo)</p>



<figure class="wp-block-image"><a href="http://bit.ly/2VxoBzb" target="_blank" rel="noreferrer noopener"><img decoding="async" src="https://media-exp1.licdn.com/dms/image/C4E12AQG2TBQ24VwQpQ/article-inline_image-shrink_1000_1488/0?e=1603929600&amp;v=beta&amp;t=IIVCExCuuFbnmNvfJbBO6xwRBWXHhWuf2fr-hs5PUvw" alt="Não foi fornecido texto alternativo para esta imagem"/></a></figure>



<h3 class="wp-block-heading">Voltando para a tela inicial e Clicando no Botão:&nbsp;<strong><u>Consultar Alunos por Região</u></strong>, iremos para a tela a seguir</h3>



<figure class="wp-block-image"><a href="http://bit.ly/2VxoBzb" target="_blank" rel="noreferrer noopener"><img decoding="async" src="https://media-exp1.licdn.com/dms/image/C4E12AQFgCJvhuRGgCg/article-inline_image-shrink_1000_1488/0?e=1603929600&amp;v=beta&amp;t=NA1Iwj6bG258wyNvRLC4Sq6VvjO3gfJOukfYYBYhBWg" alt="Não foi fornecido texto alternativo para esta imagem"/></a></figure>



<p>Essa tela é totalmente dinâmica, por exemplo, queremos saber a quantidade de alunos da Região Nordeste, mais especificamente do Estado do Ceará, no município: Juazeiro do Norte, teremos algo assim:</p>



<figure class="wp-block-image"><a href="http://bit.ly/2VxoBzb" target="_blank" rel="noreferrer noopener"><img decoding="async" src="https://media-exp1.licdn.com/dms/image/C4E12AQEvElJtzCBHmg/article-inline_image-shrink_1000_1488/0?e=1603929600&amp;v=beta&amp;t=M4S-4Ju94k_HJydICM90Z_G584QE7xDRu3Zt1bQ0xNk" alt="Não foi fornecido texto alternativo para esta imagem"/></a></figure>



<h3 class="wp-block-heading">Na tela inicial, Clicando no Botão:&nbsp;Perfil Alunos do Ceará (Privadas), iremos para a tela a seguir:</h3>



<figure class="wp-block-image"><a href="http://bit.ly/2VxoBzb" target="_blank" rel="noreferrer noopener"><img decoding="async" src="https://media-exp1.licdn.com/dms/image/C4E12AQHSnzmdPwAb0Q/article-inline_image-shrink_1000_1488/0?e=1603929600&amp;v=beta&amp;t=l_8jcckwoDYllcS4CSrHI4aE_UIHtfLkncuP92_qhzs" alt="Não foi fornecido texto alternativo para esta imagem"/></a></figure>



<ul class="wp-block-list"><li>Aqui é uma análise dinâmica de alunos de escolas particulares do Estado do Ceará, confiram!</li></ul>



<h2 class="wp-block-heading">Observações</h2>



<ul class="wp-block-list"><li>Em todas as telas tem um botão de&nbsp;voltar&nbsp;(canto inferior direito), que retorna a página principal;</li><li>Clicando em qualquer uma das imagens, aqui do artigo, abre a análise e poderá explorar a ferramenta e realizar suas análises.</li></ul>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow"><p>Espero que tenham gostado e que possa lhe ajudar de alguma forma!</p></blockquote>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow"><p>Deixe seu comentário!</p></blockquote>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow"><p>Até mais!</p></blockquote>



<h2 class="wp-block-heading">Referências</h2>



<p><a href="http://portal.inep.gov.br/web/guest/educacao-superior" target="_blank" rel="noreferrer noopener">INEP &#8211; Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira</a></p>



<p><a href="https://www.linkedin.com/pulse/o-que-%C3%A9-censo-escolar-alex-souza/" target="_blank" rel="noreferrer noopener">O que é o Censo Escolar?</a></p>



<p><a rel="noreferrer noopener" href="https://blogdozouza.wordpress.com/" target="_blank">Blog do Alex Souza</a></p>



<p><a rel="noreferrer noopener" href="https://edutechbr.wordpress.com/" target="_blank">EduTECH Brasil</a></p>



<p>Linkedin:<br><a href="https://www.linkedin.com/in/alex-souza/">https://www.linkedin.com/in/alex-souza/</a></p>



<p>#powerbi #analytics #bi #dados #dadospublicos</p>



<figure class="wp-block-embed-youtube wp-block-embed is-type-video is-provider-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="Live Alex Souza - Mestre em Ciencia da Computação - Classificação de Notícias com Machine Learning" width="500" height="281" src="https://www.youtube.com/embed/_ehtYMU7y3I?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>
<p>O post <a href="http://estatidados.com.br/censo-escolar-2019/">Censo Escolar 2019</a> apareceu primeiro em <a href="http://estatidados.com.br">Estatidados</a>.</p>
]]></content:encoded>
					
					<wfw:commentRss>http://estatidados.com.br/censo-escolar-2019/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
	</channel>
</rss>
