curso
Um guia detalhado para a arquitetura do Tableau: Desktop e servidor
Assim como em outras ferramentas ou softwares de business intelligence, as belas visualizações na superfície do Tableau, como este gráfico em cascata, são possíveis graças a processos robustos e integrados nos bastidores. A maneira como esses processos são estruturados é o que queremos dizer com a arquitetura do Tableau e é o tema deste guia abrangente.
Entender a arquitetura do Tableau é uma parte essencial do trabalho dos administradores de servidores e arquitetos de dados. No entanto, os analistas de dados também se beneficiam de uma melhor compreensão da arquitetura do Tableau. Por um lado, eles entenderão melhor os recursos e as limitações da ferramenta. Além disso, a compreensão dos componentes arquitetônicos permitirá que eles identifiquem melhor as fontes de erros e interpretem o que eles significam.
Visão geral da arquitetura do Tableau
A Tableau oferece mais de 10 produtos diferentes, e você pode contar com eles. Esses produtos podem ser divididos em duas categorias principais. A primeira categoria inclui produtos voltados para o desenvolvimento, incluindo o Tableau Server, enquanto a segunda categoria consiste em produtos voltados para a publicação, incluindo o Tableau Desktop.
Alguns desses produtos têm interfaces de usuário semelhantes e funcionalidades que se cruzam, mas cada um tem sua própria arquitetura. Embora todos eles estejam integrados em uma família, alguns foram criados para trabalhar mais estreitamente uns com os outros do que outros. O Tableau Desktop e o Tableau Server são um ótimo exemplo: O que você cria no Tableau Desktop é transferido para o Tableau Server, onde pode ser publicado, armazenado, gerenciado e compartilhado para colaboração.
Componentes principais da arquitetura do Tableau Desktop
Como profissional de dados que desenvolve relatórios, é provável que o Tableau Desktop seja a face do Tableau com a qual você está mais familiarizado. É o ponto de partida que é instalado no seu computador e onde você se conecta às fontes de dados e cria visualizações.
A arquitetura do Tableau Desktop é relativamente simples. Ele tem três componentes ou camadas principais.
- Camada de dados: A camada de dados é responsável pela conexão e pelo gerenciamento das fontes de dados.
- Camada de cálculos: A camada de cálculos lida com a transformação e os cálculos de dados.
- Camada de visualizações: A camada de visualizações cria e exibe tabelas e gráficos interativos.
Arquitetura do Desktop
Vamos dar uma olhada em cada uma dessas camadas com mais detalhes.
Camada de dados
A camada de dados é onde seus dados chegam ao Tableau Desktop e ficam prontos para serem analisados e visualizados. O funcionamento depende de como você escolhe se conectar aos seus dados, pois há dois tipos de conexão:
- Extrair conexão: Uma conexão de extração envolve a criação de um instantâneo estático dos seus dados, que é armazenado localmente dentro do seu projeto.
- Conexão ao vivo: Uma conexão em tempo real consulta diretamente a fonte de dados original em tempo real sempre que você interage com qualquer visualização.
Independentemente do tipo de conexão que você escolher, o Tableau Desktop oferece 90 conectores de dados para acessar seus dados de onde quer que eles estejam armazenados, seja em arquivos simples, servidores SQL ou plataformas de gerenciamento de documentos na nuvem.
A camada de dados também armazena informações de acesso a dados, como credenciais de localização e autorização, e fornece recursos de modelagem de dados, como agregação e união de tabelas ou alteração de tipos de dados.
Camada de cálculos
O Tableau tem um mecanismo de cálculos avançado que permite que você crie campos personalizados para fazer a análise necessária para suas visualizações, seja para fazer uma agregação, segmentação, filtragem, conversão de tipo de dados ou outra coisa.
Ele oferece três tipos principais de cálculos:
- Cálculos básicos: Os cálculos básicos permitem que você manipule os dados em um nível de linha ou em um nível agregado.
- Expressões de nível de detalhe: As expressões de LOD permitem que você faça cálculos com controle sobre o nível de granularidade.
- Cálculos de tabela: Os cálculos de tabela permitem que você execute agregações em toda a tabela ou em um conjunto de linhas.
Camada de visualizações
A camada de visualizações é onde você cria, personaliza e formata suas visualizações. Em outras palavras, é aqui que toda a diversão acontece. Essa camada oferece as três estruturas hierárquicas do Tableau para você criar seus recursos visuais.
- Planilha: A planilha é o bloco de construção de tudo o que você cria no Tableau. É uma tela onde você pode criar, filtrar e formatar qualquer gráfico.
- Painel de controle: O painel é uma tela onde você pode combinar uma ou mais planilhas e definir como elas interagem, além de adicionar outros objetos, como texto, imagens, botões, páginas da Web incorporadas e muito mais.
- História: A história é onde você pode combinar vários painéis para permitir que os usuários naveguem como um único relatório.
As três camadas do Tableau Desktop - camadas de dados, cálculos e visualizações - juntas formam uma pasta de trabalho do Tableau. Você pode salvar localmente toda a pasta de trabalho como um arquivo de pasta de trabalho em pacote do Tableau (.twbx) e compartilhá-la com outros membros da equipe para visualização e colaboração.
Lembre-se de que, se você simplesmente passasse um arquivo de pasta de trabalho do Tableau para um colega, ele teria que ter o Tableau Desktop instalado para visualizar o arquivo. Além disso, você não terá recursos de gerenciamento ou governança sobre o arquivo. Por esse motivo, publicar sua pasta de trabalho no Tableau Server é uma maneira mais eficiente de colaborar com os projetos do Tableau. Com isso em mente, vamos explorar a arquitetura do Tableau Server.
Componentes principais da arquitetura do Tableau Server
O Tableau Server em si é um grupo de processos que formam uma plataforma analítica completa. Ele permite que relatórios e fontes de dados sejam publicados, gerenciados, governados, protegidos, explorados e editados. Ele pode ser implantado no local ou em uma nuvem de sua escolha. Sua organização seria responsável por todo o gerenciamento e segurança.
A arquitetura do Tableau Server inclui pelo menos 18 componentes e subcomponentes, mas o número exato está sujeito a alterações, pois o Tableau Server passa por mudanças frequentes de desenvolvimento. Para o escopo deste artigo, expandiremos os principais componentes que estão envolvidos no processo de publicação de uma pasta de trabalho ou de acesso a uma exibição. Especificamente, explicaremos oito de seus componentes.
- Gateway: O gateway é o ponto de entrada para as solicitações do usuário, encaminhando-as para os componentes apropriados.
- Servidor de aplicativos: O servidor de aplicativos gerencia sessões, autenticação e autorização, garantindo que os usuários acessem somente os recursos permitidos.
- Servidor VizQL: O servidor VizQL traduz as interações do usuário em consultas e gera visualizações a partir dos dados.
- Repositório: O repositório armazena metadados, informações do usuário e definições de configuração, servindo como o banco de dados principal.
- Armazenamento de arquivos: O armazenamento de arquivos lida com o armazenamento e a recuperação dos arquivos de dados do Tableau, incluindo pastas de trabalho e extrações.
- Mecanismo de dados: O mecanismo de dados processa os dados executando consultas e gerenciando a computação de dados para uma análise rápida.
- Servidor de dados: O servidor de dados gerencia as conexões com as fontes de dados, otimizando e distribuindo as consultas pela rede.
- Servidor de cache: O servidor de cache melhora o desempenho armazenando em cache dados e visualizações acessados anteriormente para uma recuperação mais rápida.
Arquitetura do Tableau Server
Gateway
O gateway é como a recepção do Tableau Server. Quando um cliente chega ao Tableau Server com uma solicitação, o Tableau direciona a solicitação para os componentes relevantes para que você realize o trabalho. O cliente aqui pode se referir a um usuário do Tableau Desktop que deseja publicar seu relatório ou a um visualizador que deseja fazer logon e acessar um relatório.
Posteriormente, no processo, o gateway lida com a devolução da resposta apropriada ao cliente, seja uma exibição solicitada, uma consulta ou simplesmente uma mensagem informando que a publicação foi feita com êxito.
Servidor de aplicativos
O servidor de aplicativos é como o ajudante do gateway. Ele recebe a solicitação do gateway e a processa para garantir que a solicitação esteja pronta para seguir na direção apontada pelo gateway.
Por exemplo, se um usuário quiser publicar uma pasta de trabalho, o servidor de aplicativos a decompõe em dois arquivos: um arquivo XML que armazena todas as informações sobre os recursos visuais da pasta de trabalho e as transmite para serem armazenadas no repositório e um arquivo inventado pelo Tableau chamado Hyper, que contém os dados de origem a serem armazenados no armazenamento de arquivos.
Quando um visualizador deseja acessar o servidor, o servidor de aplicativos primeiro verifica se o usuário está registrado e seu nível de acesso, analisando os logs de usuário no repositório. Depois de confirmar essas informações, ele prepara a interface de usuário apropriada para esse usuário específico.
Servidor VizQL
O servidor VizQL é um componente interessante e exclusivo do Tableau Server, e também foi inventado por alguns dos fundadores da Tableau. O nome significa Visual Query Language e funciona como um tradutor entre a linguagem SQL dos bancos de dados e a linguagem visual das visualizações.
Por exemplo, quando um cliente interage com uma visualização, o servidor VizQL consulta a fonte de dados por meio do mecanismo de dados e do servidor de dados. Ele também recupera os metadados necessários do repositório. Quando os dados e os metadados são combinados, o servidor VizQL envia o visual para o gateway, que o entrega ao usuário.
Repositório
O repositório é o hub central para armazenar e gerenciar metadados relacionados ao Tableau Server. Os dados armazenados aqui incluem os arquivos XML das pastas de trabalho publicadas e os registros de usuários, com contas, funções e permissões de usuários. Ele também armazena dados sobre o uso dos ativos no servidor, como o número de visualizações e as fontes de dados mais usadas.
As fontes de dados usadas nas pastas de trabalho são o único tipo de dados não armazenados no repositório. Esse tipo de dados é armazenado no armazenamento de arquivos, que discutiremos a seguir.
Armazenamento de arquivos
O armazenamento de arquivos controla o armazenamento das fontes de dados extraídas no Tableau Server. Em determinados ambientes, ele também pode fazer e gerenciar cópias das extrações para garantir que os dados de origem estejam disponíveis para consulta em caso de falhas técnicas.
Mecanismo de dados
Esse é um mecanismo de banco de dados projetado especificamente para lidar com fontes de dados extraídas armazenadas no armazenamento de arquivos do Tableau Server. O mecanismo de dados transforma e otimiza essas fontes de dados extraídas usando o Hyper para armazenamento eficiente no armazenamento de arquivos.
O mecanismo de dados também atua como a interface para consultar o armazenamento de arquivos para qualquer finalidade, incluindo visualização, atualização e refrescamento das extrações de dados ou exibições baseadas nelas.
Servidor de dados
Se um usuário quiser acessar uma visualização com fontes de dados extraídas, o servidor de dados envia uma consulta a um componente chamado mecanismo de dados, que, por sua vez, consulta a fonte de dados do armazenamento de arquivos, onde reside a cópia dos dados.
Enquanto isso, se a visualização tiver fontes de dados em tempo real, o servidor de dados chamará os conectores de dados para consultar os dados de sua fonte externa.
Servidor de cache
Como o próprio nome sugere, o servidor de cache armazena um cache na memória para exibições e consultas anteriores, a fim de acelerar os resultados futuros, fornecendo resultados em cache.
Considerações sobre a implantação do Tableau em sua organização
Ao implantar o Tableau em sua organização, a primeira coisa que você deve saber é que o Tableau Server não é a única opção para publicar e colaborar com exibições e ativos de dados do Tableau. A opção que você deve considerar é o Tableau Cloud.
Enquanto o Tableau Server precisa ser totalmente gerenciado e protegido pela sua organização, o Tableau Cloud é uma plataforma com interface de usuário e funcionalidade semelhantes que seria totalmente hospedada, gerenciada e protegida pela própria Tableau.
Portanto, se a sua organização não tiver necessidades específicas de segurança e infraestrutura de TI, ou os recursos humanos e técnicos necessários para gerenciar um servidor por conta própria, o Tableau Cloud seria uma opção melhor. Caso contrário, arregace as mangas e vá em frente com o Tableau Server.
Do ponto de vista da TI, a Tableau tem um documento Blueprint e uma Pesquisa de arquitetura empresarial com uma lista completa de considerações que as organizações devem fazer antes de implantar o Tableau. Mas, além de envolver a TI, aqui estão algumas considerações gerais sobre as quais você talvez precise pensar do ponto de vista da governança.
- Estratégia de governança: Ter políticas de governança claras de antemão é crucial para decidir se e como essas políticas podem ser tecnicamente aplicadas quando você começar a implantar e gerenciar o Tableau Server.
- Fontes de dados: É importante mapear o volume e a localização das suas fontes de dados antes de implantar o Tableau Server, pois eles são outro fator determinante em relação aos componentes e ao número de nós que você precisa.
- Acesso do usuário: É importante considerar o número, a frequência e o local dos usuários antes da implementação. Isso afetaria os componentes e o número de nós de que sua organização precisa, além de decidir sobre o tipo de implementação.
- Tipo de implantação: Decida se você precisa implantar o Tableau Server no local, seja em servidores, em um data center privado ou em um ambiente de nuvem, privado ou público. O local oferece mais controle e capacidade de gerenciamento, enquanto a nuvem oferece escalabilidade e acessibilidade remota.
- Recursos de hardware: Se você planeja implantar no local, avalie suas capacidades técnicas em termos de CPU, RAM, armazenamento e largura de banda da Internet, para ver se elas atendem aos requisitos do Tableau, considerando a carga de servidor esperada e projetada.
- Treinamento e suporte: Os funcionários de sua organização estão prontos para adotar o Tableau nos diferentes estágios do processo de análise de dados? Você está pronto para usar o Tableau para engenharia de dados, análise, gerenciamento e autoatendimento? Você tem administradores de servidor com experiência no Tableau? Caso contrário, você precisará dedicar tempo ao treinamento e à preparação antes da implantação.
Saiba mais sobre o Tableau
Neste artigo, exploramos a arquitetura dos produtos mais usados do Tableau, o Tableau Desktop e o Tableau Server. Também discutimos considerações sobre a implantação do Tableau em um nível organizacional.
Se você quiser saber mais sobre o Tableau Server, experimente brincar com este painel interativo do Tableau. Você também pode assistir a esta apresentação da equipe da Tableau.
Por fim, se você está começando a usar o Tableau, temos um curso de Introdução ao Tableau e um programa completo de Fundamentos do Tableau. Se você tiver mais experiência, não hesite em tentar o programa Analista de dados do Tableau, que prepara você para a certificação Tableau Certified Data Analyst.
Aprenda a usar o Tableau com a DataCamp
curso
Analyzing Data in Tableau
curso
Creating Dashboards in Tableau
blog
O que é o Tableau - O guia completo do Tableau
Wendy Gittleson
19 min
blog
Principais perguntas da entrevista do Tableau para 2024 (iniciante a avançado)
blog
6 projetos do Tableau para ajudar a desenvolver suas habilidades
blog
O que é um banco de dados gráfico? Um guia para iniciantes
blog