curso
SQL com Power BI
O Power BI é um serviço de análise de negócios baseado em nuvem da Microsoft que permite que qualquer pessoa visualize e analise dados com mais velocidade, compreensão e eficiência. É uma ferramenta poderosa e flexível para conectar e analisar uma ampla variedade de dados. Além das várias vantagens de visualização que o Power BI oferece, ele tem recursos de conexão incríveis e prontos para uso, como a integração fácil com bancos de dados. Isso oferece mais vantagens em relação às funcionalidades e é útil para os cientistas de dados que estão acostumados a trabalhar com SQL. O Power BI fornece um conector otimizado em tempo real para o SQL Server, para que você possa criar gráficos, relatórios e dashboards com facilidade, trabalhando diretamente com uma grande quantidade de dados.
Pré-requisitos
Como este artigo se concentrará apenas no SQL com Power BI, sugerimos que você faça os seguintes cursos e tutoriais do DataCamp, que servem como uma excelente introdução:
1. Power BI
O Power BI oferece a você a capacidade de analisar e explorar dados no local e na nuvem. O Power BI permite que você colabore e compartilhe dashboards personalizados e relatórios interativos entre colegas e organizações, de forma fácil e segura.
Vantagens de usar o Power BI
O Power BI oferece certas vantagens que o tornam superior às ferramentas de análise existentes:
- Oferece uma interface baseada na nuvem e uma interface de área de trabalho.
- Fornece recursos como armazenamento de dados, descoberta de dados e dashboards interativos.
- Capacidade de carregar visualizações personalizadas
- Facilmente escalável em toda a organização.
Devido aos imensos recursos do Power BI, a Microsoft foi reconhecida como líder na "Plataforma de Análise e Business Intelligence", pelo Gartner, por 12 anos consecutivos.
Quadrante Mágico do Gartner 2019 para Plataformas de Análise e Business Intelligence
Componentes do Power BI
O Power BI consiste em vários componentes que estão disponíveis no mercado separadamente e podem ser usados exclusivamente.
A escolha do componente com o qual trabalhar depende principalmente do projeto ou da equipe. Mas nós vamos trabalhar com o Power BI desktop, já que esse é um componente usado principalmente para geração de relatórios empresariais e criação de áreas de trabalho. Além disso, os outros trabalhos geralmente começam na área de trabalho do Power BI, onde ocorre a criação do relatório.
2. Power BI Desktop
O Power BI Desktop é um aplicativo gratuito que pode ser baixado e instalado no sistema. Ele pode ser conectado a várias fontes de dados. Normalmente, um trabalho de análise começa no Power BI Desktop, onde ocorre a criação do relatório. O relatório é então publicado no serviço do Power BI, de onde pode ser compartilhado com os aplicativos móveis do Power BI para que as pessoas possam visualizar os relatórios até mesmo em celulares.
Instalação
O Power BI é executado somente em máquinas Windows. Os usuários de Mac podem criar uma VM do Windows no Azure e carregar o Power BI nela ou usar o Turbo.net, que pode transmitir o Power BI para o Mac diretamente da nuvem.
O Power BI pode ser acessado de duas maneiras:
- Você pode obtê-lo como um aplicativo na Microsoft Store e fazer o login para começar. Esta é a versão on-line da ferramenta.
- Às vezes, precisamos trabalhar no modo off-line com nossos dados. Nessas situações, faça o download do software localmente e, em seguida, instale-o. Certifique-se de que você leu todas as instruções de instalação.
Dependendo da escolha do produto, faça o download do software para o computador. Depois de aceitar o contrato de licença, verifique a instalação clicando no ícone/aplicativo do Power BI. Se a tela a seguir for exibida, você está pronto para começar.
3. Como começar
Vamos agora ter uma ideia do funcionamento do Power BI Desktop. Nesta seção, vamos explorá-lo um pouco para nos acostumarmos com sua interface.
Espaço de trabalho
A imagem abaixo destaca os principais componentes do espaço de trabalho do Power BI.
Espaço de trabalho do Power BI Desktop
Fonte de dados
O Power BI pode ser conectado a várias fontes de dados. O ícone Get Data
exibe todas as opções disponíveis de onde os dados podem ser importados para o Power BI.
4. Conexão com o SQL Server
Vamos examinar um exemplo que mostra como você pode conectar o banco de dados do servidor SQL ao Power BI Desktop e usá-lo para analisar o banco de dados.
Banco de dados de amostra
Para fins de demonstração, usaremos uma instância do SQL Server acessível publicamente no AWS e um banco de dados que foi criado com base no conjunto de dados Superstore.
Esse conjunto de dados contém informações sobre produtos, vendas, lucros etc. e nosso objetivo como analistas de dados é analisar os dados e encontrar áreas críticas de melhoria nessa empresa fictícia. Essa instância do servidor SQL foi hospedada por Ken Flerlage.
Acesso ao banco de dados de amostra
- Instale o SQL Server Management Studio(SSMS). O SSMS é um ambiente gratuito e integrado para gerenciar qualquer infraestrutura SQL. Com o SSMS, você pode implantar, monitorar e atualizar os componentes da camada de dados usados pelos seus aplicativos, bem como criar consultas e scripts.
- Após o download e a instalação no seu sistema, você verá a tela a seguir solicitando credenciais específicas.
Digite as seguintes credenciais:
Server Name: ec2-52-14-205-70.us-east-2.compute.amazonaws.com
Authentication: SQL Server Authentication
Login: SQL
Password: SQL
Agora você terá acesso ‘Read Only‘ ao banco de dados ‘SuperStoreUS‘.
No nosso exemplo, ec2-52-14-205-70.us-east-2.compute.amazonaws.com é o nome da instância, SuperstoreUS e Test são os bancos de dados, e Orders, Customers etc. são as tabelas no banco de dados SuperstoreUS. Assim, pode haver várias instâncias, e cada instância pode conter vários bancos de dados que também podem ter várias tabelas.
5. Importação de dados SQL para o Power BI
O Power BI Desktop organiza os dados em consultas. Isso significa que todos os dados são dispostos em uma estrutura semelhante a uma tabela.
Configuração da conexão
Abra o Power BI Desktop e navegue até a tela inicial. Aqui, o painel da guia Get Data
oferece muitas opções em termos de fontes de dados que podem ser conectadas ao Power BI Desktop. Vamos nos conectar ao SQL Server.
Ao clicar na opção SQL Server
, será aberta uma nova tela pedindo para informar o servidor ao qual queremos que o nosso Power BI Desktop seja conectado. Insira os detalhes e pronto.
Agora você pode clicar na tabela desejada e visualizar seu conteúdo. Para carregar uma tabela específica, basta marcar a caixa de seleção ao lado dela e carregá-la.
Modos de conectividade de dados
O banco de dados SQL pode ser conectado ao Power BI Desktop de duas maneiras, ambas as opções que aparecem na tela principal.
Importação
Como o nome sugere, o método de importação "importa" as tabelas selecionadas para o Power BI Desktop. Em seguida, o Power BI usa esses dados importados para criar uma visualização ou fazer qualquer manipulação. Para ver qualquer alteração nos dados subjacentes, precisamos atualizar os dados, o que importa todo o conjunto de dados novamente.
DirectQuery
Se você usar o DirectQuery como uma opção, nenhum dado será importado ou copiado para o Power BI Desktop. Enquanto criamos ou interagimos com os dados por meio de visualizações, o Power BI Desktop consulta a fonte de dados subjacente, o que significa que estamos sempre trabalhando com os dados atuais. No entanto, esse método oferece opções limitadas quanto à manipulação de dados, ao contrário do método de importação.
Aqui você encontra um link que detalha o método Direct Query.
6. Editor de consultas
Todas as tabelas selecionadas serão carregadas no Power BI Desktop e serão exibidas como conjuntos de dados individuais na Data view
.
A partir daqui, podemos modificar nossos conjuntos de dados. Para isso, usaremos a ajuda do Query Editor. O editor de consultas pode ser usado para modificar conjuntos de dados, independentemente de sua fonte de dados. Você pode fazer manipulações como renomear um conjunto de dados, remover uma única ou várias colunas etc. no editor de consultas.
O painel esquerdo exibe o número de consultas ativas, enquanto o painel direito é chamado de painel de Configurações de consulta e exibe todas as etapas associadas a uma consulta.
O Editor Avançado
O Editor Avançado exibe o código da consulta que está sendo executada na fonte de dados. A sintaxe corresponde a M, a Linguagem de fórmula do Power Query. Você também pode criar seu próprio código.
Salvando seu trabalho
Depois de fazer as modificações necessárias nos dados por meio do editor de consultas, selecione Close & Apply (Fechar e aplicar ) no menu File (Arquivo) do Editor de consultas. Isso aplicará as alterações aos dados no Power BI Desktop.
7. Mesclando conjuntos de dados
A mesclagem de conjuntos de dados é útil quando você deseja combinar um ou mais conjuntos de dados em um só. Essa mesclagem também é facilitada pelo Editor de consultas. Desta vez, carregaremos três tabelas do banco de dados SuperstoreUS. As tabelas são Orders
, Customers
e Returns
.
A coluna Fields é preenchida com as três tabelas selecionadas. Agora, clique no botão Edit Queries
e navegue até a opção Combine
, onde o menu suspenso exibirá a opção Merge
. Usaremos a função criar uma nova consulta mesclando as consultas existentes.
A caixa de diálogo Merge é aberta (conforme mostrado na figura a seguir) e selecionamos as tabelas a serem mescladas e o tipo de união que desejamos. Precisamos selecionar colunas que sejam comuns a ambas as tabelas.
Vamos criar uma nova consulta e nomeá-la como Orders and customers.
. Combinaremos as tabelas Orders
e Customers
por meio dessa consulta.
Essa nova consulta contém todas as colunas primárias da tabela orders
e colunas de relacionamento da tabela customers
. Exclua todas as colunas de relacionamento, exceto a última, que representa a consulta Customers
. Em seguida, selecione as colunas da consulta Customers
para adicionar à nova consulta mesclada.
A demonstração a seguir deixará o processo mais claro.
Essa consulta mesclada consiste em um único banco de dados com todas as colunas desejadas. Agora podemos trabalhar facilmente com esse único banco de dados em vez de trabalhar com várias fontes de dados, o que pode gerar confusões.
8. Criação e publicação de um Dashboard
Quando o conjunto de dados estiver pronto com todas as manipulações feitas, você poderá prosseguir com o processo de criação do Dashboard. Um dashboard do Power BI, também conhecido como tela, consiste em várias visualizações em uma única página que ajudam a contar uma história. Essas visualizações, chamadas de blocos, são fixadas no dashboard a partir dos relatórios.
Vamos agora tentar entender quais insights podemos obter usando o conjunto de dados da Superstore (Fonte: Dashboard do Power BI):
- Lucro por estado
- Vendas e lucro por segmento
- Vendas e lucro por região
- Vendas por subcategoria
- Lucro por região
- Quantidade
Depois de formatar o tamanho, a aparência e a cor, você obterá um dashboard semelhante ao que está abaixo.
Dashboard da Superstore
Publicação
Os dados só são úteis quando podem ser compartilhados entre pessoas ou organizações. Você também pode compartilhar o Dashboard ou os relatórios gerados publicando-os no Serviço do Power BI. Em seguida, podemos usar os aplicativos do Power BI para visualizar ou interagir com os painéis/relatórios.
9. Conclusão
Usar o SQL e o Power BI juntos leva a análise de dados a um novo patamar. Você pode conectar facilmente o SQL Server ao Power BI e extrair os dados diretamente para ele. O Power BI permite que os usuários alternem as conexões com um clique para aplicar consultas na memória a um conjunto de dados maior. O SQL é uma ferramenta bastante útil e, quando aproveitado com a experiência do Power BI, pode ajudar a tornar a análise mais poderosa e perspicaz.
Referências
Cursos de SQL e Power BI
curso
SQL intermediário
curso
Introdução ao Power BI
blog
O que é o Power BI? - Guia do Power BI para iniciantes
Wendy Gittleson
12 min
tutorial
Tutorial de visão geral do banco de dados SQL
DataCamp Team
3 min
tutorial
Como instalar o Power BI
DataCamp Team
3 min
tutorial