Curso
Olhar para dados brutos pode ser como tentar entender uma foto examinando apenas alguns pixels de cada vez. Fazer gráficos com seus dados permite que você tenha uma visão geral e veja o quadro completo de uma só vez. As visualizações também são uma ferramenta de marketing fácil de usar para mostrar seus dados para as pessoas interessadas. Eles ajudam as pessoas a ver padrões, relações e insights rapidamente. É uma das maneiras mais rápidas de tornar os dados significativos.
Neste guia, vamos ver os tipos de gráficos mais comuns e quando usar cada um deles. Vamos ver o que faz uma boa visualização ser diferente de uma que pode enganar e dar uma olhada em vários exemplos icônicos que moldaram essa área. No final, você vai entender melhor como criar e avaliar visualizações de dados que contam uma história clara e honesta.
Se você está começando do zero, Introdução à Visualização de Dados com Julia oferece uma maneira fácil para iniciantes aprenderem o básico sobre gráficos e narrativa de dados.
Tipos de visualizações de dados
As visualizações de dados podem ser categorizadas pelo número de variáveis envolvidas. Você está analisando de perto a distribuição de apenas uma variável? Tá tentando descrever a relação entre dois? Ou você está interessado nas interações entre vários? Vamos dar uma olhada em cada um desses cenários e nas opções de gráficos que temos para cada um deles.
Pra te ajudar a entender todos esses tipos de gráficos, recomendo este prático Folha de Referência de Visualização de Dados. Ele oferece uma referência rápida para você ver qual gráfico funciona melhor para diferentes tipos de dados. Você também deve conferir Técnicas de visualização de dados para cada caso de uso.
Visualizações univariadas
Vamos começar com o caso mais simples: você tem apenas uma variável que lhe interessa. As visualizações univariadas permitem que você se concentre em uma única variável. Eles ajudam você a entender sua distribuição, frequência ou composição rapidamente. Vamos dar uma olhada em alguns dos tipos mais comuns.
Gráfico de barras
Um gráfico de barras compara diferentes categorias de informação. Cada categoria é representada por uma barra, e a contagem para essa categoria é mostrada como a altura da barra.
Às vezes, você pode ver gráficos de barras de lado, com as barras estendendo-se horizontalmente em vez de verticalmente. Na minha experiência, esses gráficos de barras horizontais são mais úteis quando você está comparando várias categorias e as barras estão ordenadas da mais longa na parte superior à mais curta na parte inferior. Para apenas algumas categorias, eu prefiro gráficos de barras verticais.

Gráfico circular
Um gráfico circular mostra as proporções de um todo como fatias de um círculo. A escolha de usar ou não gráficos circulares costuma ser motivo de preocupação entre quem trabalha com dados. Geralmente, é mais difícil para o nosso cérebro interpretar partes de um círculo do que estimar partes de um retângulo.
Pensa em quantas brigas entre irmãos já rolaram por causa de duas fatias de torta de maçã que pareciam ter o mesmo tamanho. Mesmo assim, os gráficos de pizza são bem populares, em parte porque o formato circular ajuda a quebrar a aparência dos painéis, que geralmente são todos retangulares.
Quando você decidir usar um gráfico de pizza, só use gráficos de pizza quando tiver poucas categorias para comparar. Se você colocar muitas categorias, vai ficar complicado e difícil de ler. Depois, coloca a porcentagem real em cada fatia. Isso garante que, mesmo que o leitor tenha dificuldade em comparar as fatias relativas, ele ainda consiga entender o gráfico.

Gráfico de rosca
O gráfico de rosca é um parente próximo do gráfico de pizza. Então, vale a mesma dica: só use isso quando estiver comparando poucas categorias e mostre as proporções numéricas no gráfico pra ajudar na interpretação.
Uma vantagem prática dos gráficos de rosca é que eles têm espaço para uma legenda central. Isso pode economizar espaço no seu painel, caso ele esteja começando a ficar um pouco cheio. Também é visualmente atraente e pode adicionar um toque extra que os gráficos de pizza não têm.

Histograma
Um histograma é útil para visualizar a forma de uma distribuição. Funciona agrupando valores numéricos em intervalos e representando graficamente o número de valores que se enquadram em cada intervalo. Isso pode ser uma maneira útil de ver os valores mais comuns e identificar os que estão fora do padrão.
Embora isso possa parecer um gráfico de barras, é diferente em um ponto importante: o eixo x é uma variável contínua, não discreta.

Aqui temos um histograma das alturas dos brotos de girassol em um jardim. A gente vê que a maioria dos nossos brotos tem entre 22 cm e 28 cm. Alguns têm apenas 15 cm, enquanto outros chegam a quase 34 cm.
Gráfico de densidade
Um gráfico de densidade pode ser visto como um histograma suavizado, mostrado como uma curva contínua. Isso pode dar uma visão mais clara da distribuição subjacente. É importante notar que o eixo y não mostra realmente as contagens, mas sim a densidade, que reflete o quanto os dados estão concentrados em torno de um determinado valor. A área total sob a curva é sempre igual a 1.
Esse gráfico é útil para ver o formato de uma distribuição, em vez dos valores absolutos. Ao traçar várias distribuições no mesmo gráfico, você também pode comparar as distribuições entre si. Pra evitar confusão, recomendo limitar o número de distribuições a 3 ou menos. Também é melhor dar a cada linha sua própria cor ou tom, pra evitar confusão, principalmente com distribuições que estão próximas umas das outras.

Aqui, mostramos o tempo que as pessoas passam lendo, por visita, em duas bibliotecas diferentes. Ao traçar as densidades de ambas as distribuições juntas, podemos ver que os visitantes que vão à Biblioteca Moonlight tendem a passar mais tempo lendo do que quando visitam a Biblioteca Sunlight.
Gráfico de caixa
Se você quiser comparar várias distribuições entre si, pode usar um gráfico de caixa. Um gráfico de caixa resume as distribuições usando suas medianas, quartis e quaisquer valores atípicos. São gráficos super úteis que mostram um monte de informação rapidinho. Eles basicamente mostram todo o escopo de vários conjuntos de dados comparados entre si, de uma só vez.
Em geral, se as caixas de duas distribuições não se sobrepõem, elas podem ser bem diferentes uma da outra. Mas, se eles se sobrepõem, provavelmente não são muito diferentes. Claro, um teste estatístico como o T-Test é necessário para ter certeza, mas um gráfico de caixa pode dar uma ideia rápida sobre quais distribuições comparar entre si.

Neste gráfico de caixa, mostramos a distribuição das notas dos testes em três escolas de magia. De cara, dá pra ver quais escolas têm notas médias mais altas nos testes em comparação com as outras. Também é fácil ver quais escolas podem ter alunos excepcionais ou alunos que estão ficando para trás em relação aos colegas, observando os casos atípicos. Esse gráfico simples passa um monte de informação útil rapidinho.
Visualizações bivariadas
Até agora, só vimos gráficos que mostram uma variável. Mas e se você quiser mostrar a relação entre duas variáveis? Os gráficos bivariados são exatamente o que você está procurando. São úteis para identificar tendências, padrões e correlações.
Gráfico de dispersão
Um gráfico de dispersão pode ser o gráfico mais comum de todos. São uma maneira simples de visualizar as posições de cada um dos seus pontos de dados ao longo de dois eixos numéricos. É ideal para identificar relações, agrupamentos e valores atípicos.
Os gráficos de dispersão podem ser usados para mostrar correlações e também relações causais. Se você está mostrando uma relação causal, o normal é que a variável independente fique no eixo x e a variável dependente no eixo y. Essa convenção mostra para quem está vendo a direção em que a relação de causa e efeito existe. Além disso, se você tiver uma relação causal, deve mostrar a estatística usada para determinar a causalidade, junto com o valor p.

Neste gráfico de dispersão, mostramos a relação entre o tamanho de cada gota de chuva e a velocidade com que ela cai. Tem uma relação positiva clara entre essas duas variáveis, mostrando que as gotas de chuva tendem a cair mais rápido quando são maiores.
É importante ressaltar que este gráfico mostra uma correlação e, por si só, não indica causalidade. Então, não dá pra olhar pra esse gráfico e dizer que uma gota de chuva maior cai mais rápido porque ela é maior. Para fazer essa afirmação, precisaríamos de mais informações, como um teste estatístico ou um experimento, e teríamos que colocar essas informações extras no gráfico.
Gráfico de linhas
Um gráfico de linhas é parecido com um gráfico de dispersão. Mas, geralmente, a variável independente é o tempo, e cada ponto de dados está ligado aos pontos de dados bem ao lado dele. É melhor usar gráficos de linha com dados de séries temporais, quando você quer destacar tendências ou mudanças ao longo do tempo.

Aqui, usamos um gráfico de linhas para mostrar quanto tempo passamos lendo todos os dias durante um mês. Isso nos permite ver rapidamente quando nossa motivação para ler diminuiu e quando voltamos ao ritmo normal. Se continuarmos com isso por vários meses, talvez comecemos a ver um padrão se formando.
Para mais exemplos de como destacar tendências e mudanças ao longo do tempo, confira Visualizações de dados que capturam tendências.
Gráfico de área
Um gráfico de área é bem parecido com um gráfico de linha, mas o espaço abaixo da linha é preenchido. Isso pode facilitar para o espectador ver os totais acumulados ou interpretar os volumes. Mas, veja só, embora você possa fazer mais de um gráfico de linhas no mesmo gráfico, só deve fazer um gráfico de área em cada gráfico. Como a área sob a curva está sombreada, traçar mais de uma no mesmo gráfico pode deixar a área confusa e dificultar a leitura.

Esse gráfico de área mostra a quantidade de mel coletada ao longo do ano. Como a área abaixo da curva está preenchida, isso ajuda o observador a entender intuitivamente que estamos falando de volumes.
Gráfico de barras agrupadas e gráfico de barras empilhadas
Dois subtipos de gráficos de barras foram criados pra você comparar categorias em uma segunda variável.
Primeiro, temos gráficos de barras agrupadas. Isso mostra as diferenças entre as várias subcategorias. O eixo y é lido da mesma forma que a maioria dos gráficos de barras. Mas o eixo x tem grupos de barras, muitas vezes diferenciadas por cor ou tonalidade, que mostram subgrupos dentro de cada grupo. Esses tipos de gráficos podem passar um monte de informação rapidinho.
É melhor usar isso com só alguns subgrupos para cada grupo (eu recomendo 2 a 5, no máximo). Além disso, fique atento que esses gráficos podem facilmente começar a se estender horizontalmente se você adicionar muitos grupos ou subgrupos, ocupando bastante espaço. Se você estiver criando esses gráficos para serem visualizados digitalmente, preste atenção em como eles ficam na tela de um celular.

Neste gráfico de barras agrupadas, mostramos as preferências de suco de três turmas diferentes do jardim de infância. Basta dar uma olhada neste gráfico para saber a melhor maneira de distribuir as caixas de suco para cada sala de aula.
Depois, temos gráficos de barras empilhadas. Isso mostra as relações entre as partes e o todo em vários grupos. Isso é bem parecido com os gráficos de barras agrupadas, porque dá pra comparar diferenças sutis entre os grupos.
Mas esse gráfico tem mais duas vantagens em relação ao gráfico de barras agrupadas. Primeiro, ele mostra os totais de cada categoria também. Assim, você pode ler esses gráficos como um gráfico de barras normal e ver as diferenças nos totais entre as categorias antes de ler as diferenças nos subgrupos. Em segundo lugar, este gráfico pode ser mais condensado, fornecendo mais informações em menos espaço do que um gráfico de barras agrupadas.
A desvantagem é que às vezes pode ser complicado pegar as proporções exatas desse gráfico. Adicionar rótulos de dados com essas informações pode ajudar a resolver esse problema; só não exagere na quantidade.

Esse gráfico de barras empilhadas mostra as preferências de leitura em diferentes idades. Dentro de cada faixa etária, dá pra ver a proporção de cada gênero que foi conferido. Olhando para todas as faixas etárias, dá pra ver como a proporção de cada gênero muda, assim como o número total de livros emprestados. Por exemplo, é fácil perceber que os adultos são os que mais pegam livros emprestados e que os idosos gostam mais de não ficção do que os adolescentes.
Mapa de calor
Um mapa de calor usa a intensidade das cores para mostrar os valores em uma grade. Pense em usar isso pra correlações, tabelas de frequência ou qualquer situação em que você ache que a cor vai ajudar a ver melhor os padrões.
Uma dica importante pra lembrar pra esses tipos de gráficos é escolher um gradiente de cores que faça sentido. Por exemplo, não tem motivo pra achar que o vermelho é um número maior que o verde. Então, escolher um gradiente que vai do vermelho ao verde provavelmente não é a melhor escolha. Mas tem um motivo pra achar que cores mais escuras têm a ver com valores maiores. Então, escolher um gradiente de claro para escuro dentro de uma cor pode dar ao espectador uma noção mais intuitiva do que você está representando.
Uma exceção a isso é quando se traçam valores literais de calor. Normalmente, o vermelho é associado a temperaturas mais altas e o azul a temperaturas mais baixas. Então, se você estiver representando o calor usando um mapa de calor, um gradiente de vermelho a azul pode fazer sentido intuitivamente. Como sempre, deixe seus dados guiarem o design da sua visualização.

Esse mapa de calor mostra o nível de atividade de um gato doméstico preguiçoso, hora por hora, para cada dia de uma semana. Os azuis mais escuros mostram os momentos em que o gato estava bem ativo, talvez até correndo ou pulando. Os azuis mais claros mostram os momentos em que o gato não estava muito ativo, talvez até dormindo. A cor mostra que nossa gata é mais ativa à noite, dorme a maior parte do dia e brinca um pouco durante o dia (talvez por iniciativa do dono).
Se você quiser experimentar esses gráficos bivariados em uma plataforma de análise profissional, Visualização de dados no Power BI e Visualização de dados no Tableau mostram como criar painéis interativos que destacam padrões e tendências de forma clara.
Visualizações multivariadas
Às vezes, precisamos mostrar relações mais complexas que envolvem mais de duas variáveis. Os gráficos multivariáveis podem ajudar a mostrar as relações entre três ou mais variáveis. Eles ajudam você a explorar conjuntos de dados mais complexos, sem perder a capacidade de interpretação. Vamos ver algumas opções comuns.
Gráfico de bolhas
Um gráfico de bolhas amplia a ideia de um gráfico de dispersão ao codificar uma terceira variável como tamanho da bolha. É uma boa escolha por ser fácil de ler, já que a maioria das pessoas sabe como interpretar gráficos de dispersão. Adicionar uma variável codificada como tamanho faz sentido intuitivamente. Pra aproveitar essa intuição ao máximo, é melhor fazer com que o tamanho da bolha corresponda à magnitude.
Você pode estender este gráfico para incluir uma quarta variável codificando também a cor. Só não esqueça de colocar uma legenda e uma descrição para que quem estiver vendo o gráfico consiga entender direitinho.

Esse gráfico de bolhas mostra a quantidade relativa de joaninhas e pulgões em um jardim com flores de tamanhos diferentes. Bolhas maiores significam mais pulgões. Podemos ver bolhas maiores na parte superior do gráfico, o que mostra que há mais pulgões onde há mais joaninhas. Também percebemos que tem mais insetos nas flores mais curtas.
Gráfico de radar
Você pode pensar num gráfico de radar como uma espécie de gráfico de barras circular. Diferentes atributos são organizados na parte externa do círculo, e sua bolha é plotada ao longo de cada um desses eixos, começando pelo centro. Funciona bem para perfis ou para comparar vários itens nas mesmas dimensões. Mas cuidado pra não colocar muitas bolhas sobrepostas, porque pode ficar confuso e difícil de ler rapidinho. Também recomendo usar sombreamento transparente para que você possa ver facilmente cada bolha através das outras.

Aqui, estamos comparando três perfis diferentes de personagens de Dungeons and Dragons em cinco eixos de habilidades. Essa é uma maneira clara de mostrar as diferenças nas habilidades desses personagens diferentes.
Coordenadas paralelas
Se você desenrolar um gráfico de radar, vai ter um gráfico de coordenadas paralelas. Esses gráficos mostram cada variável em seu próprio eixo vertical. Essa é uma opção melhor quando você precisa comparar várias variáveis contínuas de uma vez, já que tem menos áreas sobrepostas.
Você vai querer pensar bem sobre quais devem ser os valores do eixo y. Se os seus diferentes atributos tiverem uma unidade comum, como os perfis de personagens acima, isso não vai ser um problema. Mas se seus atributos geralmente têm unidades diferentes, talvez você precise encontrar uma maneira de fazer uma comparação relativa de unidades para o eixo y, para tornar o gráfico mais legível. O objetivo é comparar as diferentes linhas entre si, não necessariamente extrair valores exatos para cada uma delas.

Neste gráfico, estamos comparando os atributos relativos de diferentes modelos de robôs de brinquedo. Podemos comparar facilmente cada robô com os outros em cada uma das quatro características que nos interessam. Embora não possamos calcular o valor exato da velocidade de cada robô, dá pra ver facilmente que o RoboMax é bem mais rápido que o RoboMini.
Mapa de árvore
Um mapa de árvore é uma maneira visualmente atraente de mostrar informações hierárquicas. Ele divide um retângulo em blocos aninhados cujos tamanhos variam de acordo com o valor. Muitas vezes, cores diferentes adicionam outra camada de subdivisão. É útil para mostrar dados hierárquicos ou relações entre partes e o todo em vários níveis.
Só um aviso: nem todo mundo sabe como ler treemaps, então é melhor fazer com que eles sejam o mais fáceis de entender possível. Certifique-se de que haja delimitações claras entre as caixas e cores distintas. Acho que esses gráficos são especialmente adequados para legendas, rótulos e títulos.

Aqui, criamos um mapa de árvore que mostra onde um aventureiro fictício gasta o ouro que coletou em diferentes categorias. A cor mostra a categoria de gasto, enquanto o tamanho de cada retângulo mostra a quantidade relativa de ouro que foi gasta.
Diagrama de Sankey
Um diagrama de Sankey é uma das melhores maneiras que já vi para visualizar fluxos. Esse tipo de diagrama acompanha a jornada dos seus dados desde o início até cada ponto final. A espessura das setas mostra quanto da quantidade original acabou indo para cada destino. Essa é uma ótima opção para visualizar fluxos de energia, jornadas do cliente ou qualquer sistema com caminhos ramificados.

Aqui, mostramos o uso de energia em uma casa e onde ela está sendo usada. Dá pra ver que essa casa usa mais energia pra aquecimento e conforto, enquanto cozinhar e relaxar consomem bem menos.
Mapa coroplético
Um mapa coroplético é parecido com um mapa de calor, porque usa cores para passar informações. Mas, ele é colocado em cima de um mapa geográfico, mostrando como os padrões se desenvolvem em áreas geográficas, como estados ou municípios. Você deve ter visto esses mapas durante a pandemia de COVID, mostrando onde os casos estavam aumentando. Também são comuns após as eleições presidenciais dos EUA, mostrando os resultados do colégio eleitoral.

Aqui, fizemos um mapa coroplético bem básico mostrando a estimativa da cobertura florestal em cada estado dos Estados Unidos. É fácil ver quais estados têm mais cobertura florestal, porque eles são coloridos com um tom de verde mais escuro do que aqueles com menos cobertura florestal.
Bom vs. Visualizações de dados ruins
A diferença entre gráficos úteis e enganosos geralmente está no design. Uma boa visualização deixa os dados mais claros; uma ruim distorce tudo. Para uma visão abrangente sobre o assunto, recomendo o livro de Edward Tufte Apresentação Visual de Informações Quantitativas. É um dos livros mais influentes sobre visualização e que qualquer pessoa que trabalhe regularmente com dados deveria ter na sua biblioteca.
Características das visualizações eficazes
Seu gráfico deve ser fácil de ler rapidamente. Isso quer dizer manter tudo simples e direto, colocar rótulos de dados quando for preciso e usar títulos, legendas e rótulos de eixos de forma eficaz. Tufte fala sobre isso em termos de uma relação entre dados e tinta.
Suas visualizações também devem ser o mais precisas possível. Isso quer dizer ficar de olho em qualquer distorção de escala ou proporção. Por exemplo, tenha cuidado ao usar quebras nos eixos e certifique-se de que elas sejam indicadas de forma adequada, caso você as utilize.
Para ser eficiente, você precisa ter certeza de que tudo no gráfico precisa estar lá. Não use demais as linhas da grade. Em alguns gráficos, as linhas da grade facilitam a visualização dos valores exatos. Mas, em muitos gráficos, principalmente os mais simples, eles são lixo gráfico. Nos piores casos, eles podem até mesmo ocultar dados. Outros exemplos de elementos desnecessários em gráficos incluem imagens desnecessárias ou linhas extras que não ajudam a deixar as coisas mais claras.
Por fim, pense bem no uso das cores. Entenda que as cores podem passar tanto significado quanto os números. Ao escolher um gradiente, por exemplo, geralmente é uma boa ideia fazer com que as cores mais escuras correspondam a números maiores e as cores claras a números menores.
Para dados categóricos, pense nas cores que geralmente associamos a essa categoria. Teria sido estranho se tivéssemos escolhido usar uma barra verde para indicar a preferência pelo suco de laranja.
Problemas comuns em visualizações ruins
Tem alguns erros comuns que você precisa ficar de olho. A primeira tem a ver com escalas. É importante prestar atenção à escala dos eixos e aos elementos do gráfico (caixas/bolhas/etc.). É importante não confiar cegamente nos gráficos padrão de qualquer programa que você esteja usando. Certifique-se de que seus eixos comecem em zero (com pouquíssimas exceções), que seus eixos sejam consistentes e que as proporções dos elementos do gráfico façam sentido para seus dados.
Um problema comum que vejo o tempo todo é usar efeitos 3D nos gráficos. Esses efeitos podem parecer legais, mas também podem distorcer o enredo de uma forma que torna a leitura mais difícil. Evite dores de cabeça para o seu público e use gráficos bidimensionais para a maioria dos fins.
Os eixos duplos são outro ponto em que as coisas podem ficar complicadas. Na maioria dos casos, se você precisar de dois eixos y, é melhor dividir os dados em dois gráficos. Nos poucos casos em que um gráfico de dois eixos faz sentido, certifique-se de que fica claro quais dados estão associados a cada eixo. Minha maneira favorita de fazer isso é com cores, por exemplo, o eixo à esquerda é preto e combina com os pontos pretos, enquanto o eixo à direita é vermelho e combina com os pontos vermelhos.
Um dos erros mais fáceis de cometer é sobrecarregar seu gráfico. É fácil ficar animado em contar toda a história dos nossos dados, então continuamos adicionando barras, rótulos ou linhas para contar histórias cada vez mais complicadas. Mas, fazer isso pode garantir que quem está vendo não perca nada do seu gráfico. Em vez disso, é melhor escolher uma história simples que você quer que o seu público entenda a partir dos seus dados e mostrá-la da forma mais clara e elegante possível. .
Como identificar visualizações enganosas
Infelizmente, não é raro encontrar um gráfico que foi manipulado para vender uma ideia. Isso é comum na publicidade, na política e nas redes sociais. Sempre que você vir um gráfico, é importante avaliá-lo com cuidado antes de acreditar nele sem questionar.
A primeira maneira de avaliar criticamente um gráfico é olhar as seções anteriores deste artigo e ver se o gráfico em questão segue as melhores práticas que discutimos. Se não, o gráfico pode acabar enganando, mesmo que sem querer.
Depois, pense em intenções mais maliciosas. Pergunte a si mesmo:
- Quem é a fonte e quais são suas intenções?
- A impressão que você tem bate com os números reais?
- Por que a linha do tempo começa e termina onde começa e termina?
- Os itens que estão sendo comparados são realmente comparáveis?
- Tem algum dado que tá faltando ou foi deixado de lado?
- A correlação está sendo apresentada como causalidade?
Nem todas as visualizações enganosas têm intenções maliciosas. Mas é importante reconhecer as falhas e levar as conclusões com um grão de sal.
Uma observação sobre design inclusivo
Ao criar suas próprias visualizações, lembre-se de que as escolhas de design também afetam quem pode ver seu trabalho. Para ampliar seu público, pense em como tornar seus gráficos mais acessíveis. Por exemplo, você pode usar paletas seguras para daltônicos e fontes grandes e legíveis para melhorar a legibilidade visual do seu gráfico. Usar textos alternativos e legendas significativos também pode melhorar o acesso para quem tem deficiência visual.
Visualizações famosas da história
Existem algumas visualizações ao longo da história que moldaram de forma dramática o campo da visualização de dados. Alguns inventaram novos tipos de gráficos; outros mudaram a forma como entendemos eventos, sociedades ou sistemas. Vamos dar uma olhada em alguns dos gráficos históricos mais famosos e como eles inspiraram os futuros gráficos.
As invenções de William Playfair (1786–1801)
Nossos tipos de gráficos padrão não surgiram do nada. Muitos dos gráficos que discutimos começaram com William Playfair, um engenheiro e economista político escocês que trabalhou no final do século XVIII. Em 1786, Playfair lançou O Atlas Comercial e Político, onde apresentou o gráfico de linhas e o gráfico de barras como ferramentas para entender os dados econômicos. Alguns anos depois, ele apresentou o gráfico circular no O Breviário Estatístico.

Acredita-se que este gráfico seja o primeiro gráfico de linhas, apresentado por William Playfair em 1786. Imagem obtida em Wikipedia.
Naquela época, a maioria das informações numéricas era apresentada em tabelas cheias de dados, difíceis de entender rapidinho. Playfair achava que as formas visuais podiam deixar as tendências e comparações bem claras, mesmo para quem não tinha formação em matemática.

Considerado o primeiro gráfico de barras, esse gráfico foi publicado em 1786 por William Playfair. Imagem obtida em Wikipedia.
O que tornou o trabalho de Playfair tão influente não foi só a invenção de novos tipos de gráficos, mas sua percepção sobre como as pessoas veem as informações. Ele mapeou números para propriedades visuais, permitindo que os espectadores comparassem valores rapidamente. Seus gráficos eram frequentemente usados para discutir questões políticas e econômicas, como mudanças na dívida nacional ou nas balanças comerciais ao longo do tempo.
O trabalho de Playfair criou as bases para os gráficos estatísticos modernos e serve como um lembrete de que codificações visuais claras podem mudar completamente a forma como as pessoas pensam sobre os dados.

Talvez o primeiro gráfico circular, publicado por William Playfair em 1789. Fonte: Wikipedia.
Mapa de Charles Minard da campanha russa de Napoleão (1869)
Em 1812, Napoleão invadiu a Rússia e levou uma surra. Um pouco mais de 50 anos depois, o engenheiro civil aposentado Charles Minard criou esse mapa icônico mostrando o avanço, a retirada e o trágico declínio do exército.

Fonte: brilliantmaps.
Este é um dos primeiros exemplos de um diagrama de Sankey, onde a largura da faixa mostra o número de tropas. É sobreposto em um mapa que junta direção, temperatura, geografia e tempo, contando uma história envolvente da invasão. É um exemplo bacana de como transformar dados quantitativos numa narrativa emocionante e mostra como várias variáveis podem coexistir sem confusão. É, sem dúvida, um dos gráficos históricos mais conhecidos de todos os tempos.
Diagrama da rosa de Florence Nightingale (1858)
Outro famoso gráfico de guerra veio da estatística e fundadora da enfermagem moderna, Florence Nightingale. Ela usou um gráfico polar, também chamado de diagrama rosa, para mostrar que mais mortes na Guerra da Crimeia foram causadas por doenças evitáveis, como cólera e tifo, do que por ferimentos reais em batalha.

Fonte: https://www.historyofinformation.com/
Cada fatia no diagrama representava um mês, e as cores diferenciavam as causas de morte. As mortes por doenças evitáveis estão em azul, as por ferimentos de batalha estão em vermelho e todas as outras causas estão em preto.
Em abril de 1855, uma Comissão Sanitária chegou para melhorar o saneamento no hospital militar. O resultado foi uma queda dramática no número de mortes, que se destacou bem no gráfico de Nightingale. Essa visualização convenceu os funcionários do governo a fazer melhorias sanitárias nos hospitais militares e civis.
Mapa da cólera de John Snow (1854)
Outra vitória na saúde pública foi garantida com o mapa de John Snow, que mostrava as mortes por cólera em Londres. Em 1854, o bairro de Soho, em Londres, teve um surto de cólera que foi um desastre, matando mais de 600 pessoas em só algumas semanas. Snow marcou as mortes por cólera num mapa das ruas de Londres, com as mortes representadas por barras e as bombas de água por círculos.

Fonte: londonmuseum.org.
O mapa dele mostrou vários casos de mortes perto da bomba d'água da Broad Street. Depois que os funcionários tiraram a alavanca da bomba d'água, deixando-a inutilizável, o surto diminuiu. Esse mapa ajudou a resolver o surto local. Hoje, isso serve como um lembrete de como escolher a visualização certa pode afetar seu impacto; por exemplo, um gráfico de dispersão não teria encontrado a causa do surto. Snow usou a visualização certa para fazer a mudança acontecer.
Horário dos trens de Étienne-Jules Marey (1885)
Meu gráfico histórico favorito é esse horário de trens de 1885. Esse gráfico mostra todos os trens que vão de Paris a Lyon: a velocidade, as paradas e quando eles vão cruzar com outro trem. O tempo está no eixo x, e cada estação está espaçada no eixo y em relação à sua distância das outras. Cada trem é representado por uma linha inclinada. As linhas mais inclinadas mostram que os trens estão mais rápidos, e as partes horizontais indicam quando o trem está na estação.

Fonte: commons.wikimedia.org
Normalmente, essas informações seriam apresentadas como um cronograma cheio de texto. Em vez disso, esse gráfico juntou informações de espaço e tempo de um jeito bacana que ajudou os gerentes ferroviários a evitar conflitos de programação e até colisões de trens! Isso mostra o quanto uma visualização bem feita pode passar de informação.
W.E.B. Retratos de dados de Du Bois (1900)
Na virada do século XX, o sociólogo e ativista dos direitos civis W.E.B. Du Bois liderou uma equipe de pesquisadores na criação de uma série de gráficos ousados e originais para a Exposição de Paris de 1900. Essas imagens mostram como era a vida social, econômica e educacional dos negros americanos só uma geração depois da emancipação. Numa época em que a pseudociência racista dominava o discurso público, Du Bois usou dados para enfrentar diretamente os estereótipos prejudiciais.

Esse gráfico do Data Portraits, de WEB Du Bois, mostra de forma impressionante como a Proclamação de Emancipação mudou a vida dos afro-americanos. Imagem obtida em Como W.E.B. Du Bois usou a visualização de dados para enfrentar o preconceito no início do século XX.
Os gráficos falavam sobre coisas como alfabetização, posse de imóveis, emprego, crescimento populacional e padrões de migração. Muitos foram desenhados e pintados à mão, usando cores vivas e layouts não convencionais. Embora alguns desses gráficos se assemelhem a gráficos de barras ou gráficos circulares, outros experimentam espirais, layouts radiais e composições abstratas. Em vez de seguir as convenções, Du Bois priorizou a comunicação e o impacto.

Esse gráfico modificado mostra as profissões que os americanos negros e brancos tinham no começo do século XX. Imagem obtida em Como W.E.B. Du Bois usou a visualização de dados para enfrentar o preconceito no início do século XX.
Du Bois não buscava a neutralidade. Os gráficos foram feitos especialmente pra convencer, ensinar e mostrar a humanidade e as conquistas dos negros americanos através dos dados. Ao fazer isso, Du Bois mostrou que visualização não é só sobre apresentar números. É sobre enquadrar a realidade, contar histórias e moldar a forma como as sociedades se entendem a si mesmas. Esses gráficos agora estão reunidos no livro “ ” (O que é o mundo? O que é a vida? O que é a mente?) W.E.B. Retratos de dados de Du Bois: visualizando a América negra: a linha da cor na virada do século XX.

WEB Du Bois não tinha medo de experimentar tipos de gráficos radicais para mostrar seu ponto de vista, como esse gráfico em espiral que mostra a distribuição populacional dos negros americanos em 1890. Imagem obtida em Como W.E.B. Du Bois usou a visualização de dados para enfrentar o preconceito no início do século XX.
Conclusão
A visualização não é neutra; cada escolha que você faz molda a interpretação dos espectadores sobre a história por trás dos dados. Pra saber mais sobre como contar a história dos seus dados de um jeito eficaz, dá uma olhada na nossa Folha de Referência sobre Comunicação e Narração de Dados.
Pra dicas práticas sobre quais ferramentas usar, dá uma olhada na nossa lista das 12 das melhores ferramentas de visualização de dados em 2025 é um ótimo recurso. E se você estiver pronto para tornar esses gráficos complexos interativos e prontos para a web, Visualização interativa de dados com Bokeh te mostra como criar visualizações responsivas e compatíveis com navegadores em Python.

Sou PhD e tenho 13 anos de experiência trabalhando com dados em um ambiente de pesquisa biológica. Crio software em várias linguagens de programação, incluindo Python, MATLAB e R. Sou apaixonado por compartilhar meu amor pelo aprendizado com o mundo.
Perguntas frequentes sobre visualização de dados
Quais são os princípios principais que fazem uma boa visualização de dados?
Clareza, eficiência, precisão e honestidade. Sua visualização deve ser organizada, com uma mensagem direta que represente honestamente seu conjunto de dados.
Como posso usar as cores de forma eficaz nas minhas visualizações de dados?
Três coisas que você pode fazer são: 1.) Escolha cores que reforcem sua mensagem2.) Use cores que geralmente representam as variáveis que você está usando3.) Escolha cores que sejam suficientemente diferentes umas das outras para facilitar a leitura
Como posso garantir que minhas visualizações de dados sejam acessíveis a todos?
Escolha esquemas de cores adequados para daltônicos sempre que possível. Além disso, certifique-se de que o texto alternativo, os rótulos de dados e as legendas sejam suficientemente explicativos. Por fim, os elementos do seu gráfico, incluindo texto e linhas, devem ser grandes o suficiente para que pessoas com deficiência visual possam ver, ou ter uma funcionalidade interativa de zoom.
Quais são as melhores ferramentas para criar visualizações de dados interativas?
Ferramentas comuns incluem:
- Tableau
- Power BI
- R Shiny
- Python plotly
Quem fez os primeiros gráficos?
Muitos dos tipos de gráficos comuns que conhecemos, incluindo gráficos de barras e gráficos de dispersão, foram inventados por William Playfair.