Pular para o conteúdo principal
InicioTutoriaisPlanilhas

Um guia abrangente para o cálculo de distribuições de frequência no Excel

Siga nosso guia passo a passo para criar distribuições de frequência no Excel usando a função FREQUENCY() com apenas dois argumentos: data_array e bins_array.
Actualizado 30 de jul. de 2024  · 11 min leer

Uma distribuição de frequência, geralmente visualizada com um histograma de frequência, organiza os pontos de dados em intervalos especificados, permitindo que você entenda facilmente a frequência com que cada valor ocorre. Essa técnica é essencial para identificar padrões, tendências e possíveis discrepâncias, fornecendo insights mais profundos sobre os dados.

Este tutorial explorará as distribuições de frequência, sua importância na análise de dados e como criá-las. Com o Microsoft Excel, você verá um guia passo a passo para gerar uma distribuição de frequência para um conjunto de dados do mundo real e interpretar os resultados para obter insights significativos.

A resposta rápida: Como criar uma distribuição de frequência no Excel

Para criar uma distribuição de frequência no Excel, use a função FREQUENCY(). A função calcula a frequência com que os valores ocorrem em intervalos especificados, conhecidos como compartimentos.

Siga estas etapas:

  • Comece inserindo seus dados em uma coluna.
  • Defina seus compartimentos em outra coluna.
  • Em uma nova célula, digite =FREQUENCY(data_array, bins_array), em que data_array é o intervalo das células de dados e bins_array é o intervalo dos compartimentos.
  • Exemplo: =FREQUENCY(A2:A16, B2:B6).
  • Pressione Enter para obter a distribuição de frequência.

Cálculo da distribuição de frequência com a função FREQUENCY()Cálculo da distribuição de frequência com a função FREQUENCY() . Imagem do autor

Por que as distribuições de frequência são importantes

Uma distribuição de frequência é uma técnica estatística que organiza os dados em categorias ou intervalos. Geralmente, o resultado é uma tabela que exibe o número de observações para um intervalo fornecido dos dados subjacentes.

As distribuições de frequência são úteis de várias maneiras:

  • Resumo dos dados: As distribuições de frequência resumem grandes conjuntos de dados de forma organizada e compreensível. Isso nos permite ter uma visão geral rápida da distribuição de valores.
  • Representação visual: A distribuição de frequência pode ser facilmente representada como histogramas e gráficos de pizza, proporcionando uma compreensão visual dos dados.
  • Identificação de padrões, tendências e exceções: Eles revelam padrões nos dados, como picos, clusters e outliers. Ele pode ser usado na análise estatística para explorar ainda mais a forma e as características dos dados.
  • Comparação de dados: A distribuição de valores permite que você compare diferentes conjuntos de dados e entenda as semelhanças e diferenças.
  • Comunicação: As distribuições de frequência podem ser usadas como uma ferramenta simples e eficaz para comunicar as percepções dos dados a um público mais amplo, incluindo os tomadores de decisão.
  • Tomada de decisões: Uma compreensão clara da distribuição e de seus padrões ajuda na tomada de decisões. Por exemplo, entender o fornecimento de produtos por estação ajudará você a decidir quando fazer compras.

Agora que você já entendeu as distribuições de frequência e sua importância, vamos nos aprofundar em vários métodos para criá-las no Microsoft Excel.

Métodos para criar uma distribuição de frequência no Excel

Imagine que você trabalha em uma empresa de cosméticos que oferece produtos para uma ampla gama de faixas etárias. Agora, eles estão procurando se especializar em alguns produtos voltados para uma faixa etária específica que tenha mais clientes. Para entender isso, você tem a tarefa de analisar os clientes por faixa etária.

Para resolver isso, eles coletaram dados sobre a idade do cliente no banco de dados de clientes. A tabela a seguir foi fornecida a você:

Conjunto de dados de idade do clienteConjunto de dados de idade do cliente. Imagem do autor

Como parte da análise da demanda por faixa etária do cliente, você percebeu que calcular a distribuição de frequência será um bom ponto de partida. Aqui estão quatro métodos para calcular a distribuição de frequência usando o Microsoft Excel.

Método 1: Usando o FREQUENCY() função

A função FREQUENCY() calcula a distribuição de frequência dos dados fornecidos e retorna uma lista que mostra a frequência dos valores em determinados intervalos.

Aqui está a sintaxe da função FREQUENCY():

=FREQUENCY(data_array, bins_array)

A função recebe dois parâmetros:

  1. data_array: Uma matriz ou referência a um conjunto de valores para os quais você deseja contar as frequências. Se data_array não contiver valores, FREQUENCY() retornará uma matriz de zeros.
  2. bins_array: Uma matriz ou referência a intervalos nos quais você deseja agrupar os valores em data_array. Se bins_array não contiver valores, FREQUENCY() retornará o número de elementos em data_array.

Ambos os parâmetros são necessários para calcular a distribuição de frequência. Você só recebe o endereço data_array, que é a idade do cliente. Portanto, você deve definir o bins_array por conta própria.

Para esse caso de uso, podemos definir os compartimentos como <20, 20-30, 30-40, 40-50, 50-60 e >60. Preencha a coluna B em sua planilha, conforme mostrado abaixo.

fórmula para distribuição de frequência usando a função FREQUENCY()A A fórmula para distribuição de frequência usando a função FREQUENCY(). Imagem do autor

Depois de preparar os sites data_array e bins_array, escreva a fórmula para calcular a distribuição de frequência na célula C2.

=FREQUENCY(A2:A16, B2:B6)

O resultado da execução da fórmula acima será parecido com o seguinte:

Distribuição de frequência usando a função FREQUENCY()

Distribuição de frequência usando a função FREQUENCY() . Imagem do autor

Observando a distribuição de frequência acima, você verá:

  • A empresa tem apenas um cliente com menos de 20 anos de idade.
  • Cinco clientes estão na faixa etária de 20 a 30 anos e de 30 a 40 anos.
  • Três clientes estão na faixa etária de 40 a 50 anos.
  • Um cliente está na faixa etária de 50 a 60 anos.
  • Nenhum cliente tem mais de 60 anos.

Com base na distribuição de frequência, você entende que a maioria dos clientes tem entre 20 e 40 anos de idade.

Método 2: Usando tabelas dinâmicas

As tabelas dinâmicas são uma maneira rápida e fácil de resumir e analisar grandes quantidades de dados. As tabelas dinâmicas oferecem recursos como agregação, agrupamento e segmentação, para citar alguns.

Para calcular a distribuição de frequência usando tabelas dinâmicas, clique em Inserir no menu e selecione Tabela dinâmica.

Inserir tabela dinâmicaInserir tabela dinâmica. Imagem do autor

Especifique o intervalo de dados para o qual você deseja criar a tabela dinâmica. No seu caso, o intervalo de dados é A2:A16. Selecione New Worksheet para obter o resultado em uma nova planilha.

Depois de especificar o intervalo de dados, pressione OK.

Especificação dos parâmetros da tabela dinâmicaEspecificação dos parâmetros da tabela dinâmica. Imagem do autor

Ao clicar em OK, você verá o painel Campos da tabela dinâmica no lado direito da janela. Para criar uma tabela dinâmica para a idade do cliente, arraste e solte a idade do cliente em Linhas e valores.

Personalizar a tabela dinâmica

Personalize a tabela dinâmica. Imagem do autor

Depois que você arrastar e soltar o campo Customer Age, o painel direito terá a aparência abaixo:

Tabela pivotante personalizada

Tabela pivotante personalizada. Imagem do autor

A tabela dinâmica gerada terá a seguinte aparência:

Tabela dinâmica da idade do cliente

Tabela dinâmica da idade do cliente. Imagem do autor

Se você observar a tabela dinâmica acima, isso é diferente do que você está procurando. O caso de uso é analisar o número de clientes por faixa etária.

Faltam-nos duas coisas:

  1. A coluna Idade do cliente não está agrupada.
  2. Estamos interessados no número de clientes em cada grupo, não na soma de suas idades.

Vamos consertar isso.

Clique com o botão direito do mouse em um valor de linha e selecione Group (Agrupar).

Agrupar os valores de linha na tabela dinâmica

Agrupe os valores das linhas na tabela dinâmica. Imagem do autor

Preencha os parâmetros de agrupamento. Em nosso exemplo, escolhemos os compartimentos como 20, 30, 40, 50 e 60. Portanto, começamos em 20 e terminamos em 60 com um incremento de 10.

Agrupamento de tabela dinâmica

Agrupamento da tabela dinâmica. Imagem do autor

Após o agrupamento, o resultado terá a seguinte aparência:

Tabela dinâmica agrupada

Tabela dinâmica agrupada. Imagem do autor

Em seguida, precisamos alterar Sum para Count. Para alterar isso, clique com o botão direito do mouse na célula Soma da idade do cliente e selecione Configurações do campo de valor.

Configurações do campo de valor na tabela dinâmicaConfigurações do campo de valor na tabela dinâmica. Imagem do autor

Na caixa de diálogo pop-up, em Summarize Values By (Resumir valores por), altere Sum (Soma) para Count (Contar ) e pressione OK.

Configurações do campo de valorConfigurações do campo de valor. Imagem do autor

Quando você o atualizar, o resultado será semelhante:

Distribuição de frequência usando uma tabela dinâmica

Distribuição de frequência usando uma tabela dinâmica. Imagem do autor

Você estava procurando esse resultado - você tem a distribuição de frequência por idade do cliente.

Método 3: Usando o Data Analysis ToolPak

O Data Analysis Toolpak é um suplemento adicional para o Microsoft Excel que ajuda a calcular métricas comumente usadas em tarefas de análise de dados.

Esse suplemento não é ativado por padrão. Portanto, verifique no canto superior direito o ícone Análise de dados na guia Dados da pasta de trabalho do Excel.

ToolPak no ExcelData Analysis Data Analysis ToolPak no Excel. Imagem do autor

 

Se você não vir o ícone como mostrado acima, o suplemento não foi ativado. Para ativá-lo, clique em File (Arquivo ) no menu e selecione Options (Opções).

Seleção de opções na guia FileSeleção de opções na guia File. Imagem do autor

Selecione Suplementos quando a caixa de diálogo Opções do Excel for aberta.

Selecione Add-ins na caixa de diálogo Opções do ExcelSelecione Add-ins na caixa de diálogo Opções do Excel. Imagem do autor

Em seguida, selecione Suplementos do Excel na caixa Gerenciar na parte inferior e clique em Ir.

suplementosGerenciando os do ExcelGerenciando os suplementos do Excel. Imagem do autor

Marque Analysis ToolPak quando a caixa de diálogo Add-Ins for aberta e clique em OK.

Ativando o Data Analysis ToolPak

Habilitando o Data Analysis ToolPak. Imagem do autor

O ícone Análise de dados estará visível na guia Dados agora, e você não precisará repetir esse processo, pois a ativação do suplemento é uma tarefa única.

Selecione o intervalo de dados, incluindo o cabeçalho da coluna, para calcular a distribuição de frequência. Clique no ícone Análise de dados. Uma caixa de diálogo será exibida. Escolha o histograma e clique em OK.

suplementoInvocando o Data Analysis ToolpakInvocando o suplemento Data Analysis Toolpak. Imagem do autor

Você será solicitado a abrir uma caixa de diálogo, conforme mostrado abaixo.

Personalização dos parâmetros do histogramaPersonalização dos parâmetros do histograma. Imagem do autor

Preencha o intervalo de entrada com o intervalo de dados de idade do cliente e o intervalo de compartimentos com compartimentos.

  • Você tem os dados de idade do cliente nas células A2:A16.
  • Você tem os dados Bins nas células B2:B6.
  • Nas opções de Saída, selecione Nova planilha para obter a saída em uma nova planilha.
  • Clique em OK.

Você verá a distribuição de frequência em uma nova planilha, como a que está abaixo.

Distribuição de frequência usando o Data Analysis Toolpak

Distribuição de frequência usando o Data Analysis Toolpak. Imagem do autor

Voila! Você tem a distribuição de frequência por faixa etária criada usando o Data Analysis ToolPak.

Método 4: Usando as funções COUNTIF() e COUNTIFS()

A função COUNTIF() conta o número de vezes que um único critério é atendido. A função COUNTIFS() conta o número de células que atendem a vários critérios.

Para calcular a frequência para cada faixa etária, insira as fórmulas abaixo nas células D2 a D7, respectivamente.

# In cell D2
=COUNTIF(A2:A16, "<=20")
# In cell D3
=COUNTIFS(A2:A16, ">20", A2:A16, "<=30")
# In cell D4
=COUNTIFS(A2:A16, ">30", A2:A16, "<=40")
# In cell D5
=COUNTIFS(A2:A16, ">40", A2:A16, "<=50")
# In cell D6
=COUNTIFS(A2:A16, ">50", A2:A16, "<=60")
# In cell D7
=COUNTIF(A2:A16, ">60")

Aqui está um exemplo de como você pode adicionar a fórmula às células. Depois que você calcular todos eles, o resultado será semelhante:

função COUNTIF()Calcule a distribuição de frequência usando a Calcule a distribuição de frequência usando a função COUNTIF() . Imagem do autor

Em comparação com outros métodos discutidos, uma limitação do uso do site COUNTIF() é que ele exige intervalos de compartimentos predefinidos na equação.

O método mais comum para criar a tabela de distribuição de frequência é usar a função FREQUENCY()

No entanto, sinta-se à vontade para usar o método que você achar mais confortável. Por exemplo, o uso do Data Analysis Toolpak pode ser mais adequado se você também estiver calculando outras medidas estatísticas, como skewness, ANOVA ou matriz de correlação, como parte da análise.

Considerações finais

Neste tutorial, aprendemos a importância da distribuição de frequência e como calculá-la usando o Microsoft Excel. Ao trabalhar com um exemplo do mundo real, aprendemos a usar a função FREQUENCY() e a interpretar a distribuição resultante para obter insights sobre nossos dados. Exploramos três maneiras alternativas de calcular a distribuição de frequência.

O aprendizado não precisa parar por aqui, e incentivamos você a continuar aprendendo e expandindo suas habilidades em Excel. Considere a possibilidade de cursar o programa Excel Fundamentals para que você possa construir sua base com o Excel. Os cursos Preparação de dados no Excel e Visualização de dados no Excel podem ajudar você a ampliar seu conhecimento sobre esses tópicos. Dê uma olhada na Planilha de Manipulação de Dados no Excel, que pode servir como uma referência rápida.

Feliz aprendizado!!!

Perguntas frequentes

O que são compartimentos em uma distribuição de frequência?

Bins são intervalos que agrupam pontos de dados em uma distribuição de frequência. Cada compartimento representa um intervalo de valores, e a frequência é a contagem de pontos de dados em cada compartimento.

Como faço para criar compartimentos personalizados para minha distribuição de frequência?

A criação de compartimentos personalizados difere de acordo com o método que você usa. As opções incluem o uso da função FREQUENCY(), o uso de tabelas dinâmicas, o uso do Data Analysis Toolpak e o uso da função COUNTIF().

Qual é a diferença entre COUNTIF() e COUNTIFS()?

COUNTIF() conta o número de ocorrências que atendem a uma única condição. COUNTIFS() conta o número de ocorrências que atendem a várias condições.

Como você cria uma distribuição de frequência com tamanhos de compartimento desiguais?

Modificar os valores dos compartimentos. Por exemplo, se você tinha 20, 30, 40, 50 e 60 como compartimentos anteriormente, pode alterá-los para 20, 30, 50 e 60, onde o intervalo de 30-50 torna os tamanhos dos compartimentos desiguais. Depois disso, a função FREQUENCY() é usada como de costume para calcular a distribuição de frequência.

Quais são algumas das limitações do uso de COUNTIF() no cálculo da distribuição de frequência?

COUNTIF() requer intervalos de compartimentos predefinidos. A alteração do intervalo de compartimentos exige uma atualização manual de cada fórmula do site COUNTIF().

Temas

Aprenda com a DataCamp

Course

Data Analysis in Excel

3 hr
46.1K
Learn how to analyze data with PivotTables and intermediate logical functions before moving on to tools such as what-if analysis and forecasting.
See DetailsRight Arrow
Start Course
Ver maisRight Arrow
Relacionado

tutorial

As 15 fórmulas básicas do Excel que todos precisam saber

Aprenda a adicionar fórmulas aritméticas, de cadeia de caracteres, de séries temporais e complexas no Microsoft Excel.
Abid Ali Awan's photo

Abid Ali Awan

15 min

tutorial

Tutorial do Power BI Calculate

Aprenda a usar a função CALCULATE do Power BI e dê exemplos de como você pode usá-la.
Joleen Bothma's photo

Joleen Bothma

6 min

tutorial

Como calcular o desvio padrão no Excel

Para calcular o desvio padrão no Excel, insira seus dados em um intervalo de células e use =STDEV.S() para dados de amostra ou =STDEV.P() para dados de população.
Arunn Thevapalan's photo

Arunn Thevapalan

10 min

tutorial

Teste de qui-quadrado em planilhas

Neste tutorial, você aprenderá a realizar o teste qui-quadrado em planilhas.
Avinash Navlani's photo

Avinash Navlani

10 min

tutorial

Como fazer um VLOOKUP() com vários critérios

Domine a arte de usar VLOOKUP() com vários critérios no Excel. Explore técnicas avançadas, como colunas auxiliares e a função CHOOSE().
Laiba Siddiqui's photo

Laiba Siddiqui

10 min

tutorial

FUNÇÃO SQL COUNT()

COUNT() permite que você conte o número de linhas que correspondem a determinadas condições. Saiba como usá-lo neste tutorial.
Travis Tang 's photo

Travis Tang

3 min

See MoreSee More