Pular para o conteúdo principal

Como encontrar o tamanho de um DataFrame em Python

Há várias maneiras de encontrar o tamanho de um DataFrame em Python para atender a diferentes necessidades de codificação. Consulte este tutorial para obter uma introdução rápida sobre como descobrir o tamanho de um DataFrame. Este tutorial apresenta várias maneiras de verificar o tamanho do DataFrame, de modo que você certamente encontrará uma maneira que atenda às suas necessidades.
Actualizado 15 de jan. de 2025  · 5 min de leitura

Os DataFrames são um tipo de dados amplamente usado em scripts Python. Entender o tamanho de um DataFrame em Python é crucial para muitas finalidades, incluindo determinar quanta alocação de memória será necessária ao usar o DataFrame e garantir que seu script não tente chamar um elemento fora dos limites do DataFrame. Felizmente, há várias maneiras de encontrar o tamanho de um DataFrame em Python, permitindo que um programador Python use métodos diferentes para acomodar diferentes estilos e situações de codificação.

Vamos discutir como você pode encontrar o tamanho de um DataFrame em Python.

Entendendo os DataFrames do Python

Os DataFrames são uma forma de organizar informações em Python que é muito comum na ciência de dados. Existem alguns componentes principais que tornam os DataFrames excepcionalmente úteis em projetos de dados.

Em primeiro lugar, as informações nos DataFrames são organizadas como uma tabela, que é fácil de ler e entender. Em segundo lugar, as informações são mutáveis, o que significa que os elementos do DataFrame podem ser alterados após a criação. Você pode adicionar facilmente novos elementos ou atualizar ou remover elementos existentes em um DataFrame.

Os DataFrames também são úteis por sua ordenação. Os elementos são mantidos no DataFrame na mesma ordem em que são adicionados, a menos que sejam explicitamente alterados, como, por exemplo, pela classificação.

Por fim, os DataFrames contêm um índice, a partir de 0, que permite que você selecione um elemento individual com base em sua posição dentro do DataFrame.

Você pode saber mais sobre DataFrames no curso de manipulação de dados com pandas do DataCamp ou neste tutorial de pandas em Python.

Tamanho do DataFrame Python: Usando df.shape no Pandas para uso geral

O Python pandas é uma biblioteca que permite que os analistas trabalhem facilmente com DataFrames. Essa biblioteca tem um método de forma simples usado para encontrar o tamanho de um DataFrame.

import pandas as pd

# Creating a sample DataFrame
df = pd.DataFrame({'Name': ['Alice', 'Bob', 'Charlie'],
                   'Age': [25, 30, 22],
                   'City': ['New York', 'San Francisco', 'Los Angeles']})

# Using shape to get the size
rows, columns = df.shape
print(f"Number of rows: {rows}, Number of columns: {columns}")
Output: Number of rows: 3, Number of columns: 3

O método df.shape fornece informações sobre o número de linhas e colunas em um DataFrame de forma rápida e fácil.

Conclusão principal: df.shape é a função que você deve usar para descobrir o tamanho de um DataFrame.

Usando len() apenas para o número da linha

Um dos métodos mais simples e mais comumente usados para encontrar o comprimento de uma lista, a função incorporada len() também pode ser usada para encontrar o número de linhas em um DataFrame. Esse método é conciso e eficiente. No entanto, ela fornece informações limitadas em comparação com a função df.shape.

import pandas as pd

# Creating a sample DataFrame
df = pd.DataFrame({'Name': ['Alice', 'Bob', 'Charlie'],
                   'Age': [25, 30, 22],
                   'City': ['New York', 'San Francisco', 'Los Angeles']})

# Using len to get the number of rows
num_rows = len(df)
print(f"Number of rows: {num_rows}")
Output: Number of rows: 3

Quando se trata de verificar o comprimento de uma lista em Python, len() é raramente usado em comparação com df.shape. No entanto, essa pode ser uma maneira rápida de examinar o número de linhas em um DataFrame sem a biblioteca pandas.

Conclusão principal: len() é uma função integrada que você pode usar como alternativa ao pandas.

df.info() para obter informações mais detalhadas

Para situações em que você precisa de uma medida mais detalhada do tamanho, experimente o método df.info() do pandas. Essa abordagem fornece a você o número de linhas e colunas no DataFrame, bem como informações sobre o tipo de dados em cada coluna e o número de valores nulos.

import pandas as pd

# Creating a sample DataFrame
df = pd.DataFrame({'Name': ['Alice', 'Bob', 'Charlie'],
                   'Age': [25, 30, 22],
                   'City': ['New York', 'San Francisco', 'Los Angeles']})

# Using info to get information about the DataFrame
df.info()
Output: 

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   Name    3 non-null      object
 1   Age     3 non-null      int64 
 2   City    3 non-null      object

dtypes: int64(1), object(2)
memory usage: 204.0+ bytes

Com esse método, o número de linhas é listado em RangeIndex. No exemplo acima, ele mostra que há três linhas (chamadas de entradas aqui) e que o índice começa em 0 e termina em 2. O número de colunas está listado abaixo. Em seguida, o nome de cada coluna é listado junto com o número de entradas não nulas em cada coluna e seu tipo de dados.

Conclusão principal: df.info() pode fornecer informações mais detalhadas sobre um DataFrame.

Dicas e práticas recomendadas para o tamanho do DataFrame em Python

Ao encontrar o tamanho de um DataFrame em Python, você deve ter em mente algumas práticas recomendadas.

  1. Escolha o método que funciona melhor para seu DataFrame. Lembre-se de que df.shape fornece rapidamente o número de linhas e colunas, enquanto df.info fornece informações extras que você pode ou não precisar para o seu propósito.
  2. Certifique-se de que você instalou e importou todas as bibliotecas necessárias. A biblioteca pandas é um elemento básico quando você trabalha com DataFrames.
  3. Documente bem seu trabalho. Certifique-se de usar comentários descritivos para que os futuros codificadores possam decifrar o que você fez e por quê.

Conclusão

Há várias maneiras de encontrar o tamanho de um DataFrame em Python, dependendo de suas preferências e dos requisitos de código. Se você precisa de simplicidade ou de insights detalhados, há uma abordagem que atende às suas necessidades específicas.

Sempre considere a natureza dos seus dados e os insights que você pretende obter ao determinar a abordagem a ser usada. Para saber mais sobre como usar o Python DataFrames, confira o curso Introdução ao Python do DataCamp ou o curso Python Intermediário para Finanças. Ou experimente o curso de carreira de cientista de dados em Python da DataCamp.

Você também pode conferir o polars, um concorrente mais recente do pandas para análise de DataFrame de alto desempenho. Você pode ler mais sobre a diferença entre pandas e polares ou descobrir uma introdução ao uso de polares.


Amberle McKee's photo
Author
Amberle McKee
LinkedIn

Sou PhD e tenho 13 anos de experiência trabalhando com dados em um ambiente de pesquisa biológica. Crio software em várias linguagens de programação, incluindo Python, MATLAB e R. Sou apaixonado por compartilhar meu amor pelo aprendizado com o mundo.

Temas

Continue aprendendo Python! 

programa

Python Data Fundamentals

30hrs hr
Grow your data skills, discover how to manipulate and visualize data, and apply advanced analytics to make data-driven decisions.
Ver DetalhesRight Arrow
Iniciar curso
Ver maisRight Arrow
Relacionado

tutorial

Pandas Tutorial: DataFrames em Python

Explore a análise de dados com Python. Os DataFrames do Pandas facilitam a manipulação de seus dados, desde a seleção ou substituição de colunas e índices até a remodelagem dos dados.
Karlijn Willems's photo

Karlijn Willems

20 min

tutorial

Tutorial de seleção de colunas em Python

Use o Python Pandas e selecione colunas de DataFrames. Siga nosso tutorial com exemplos de código e aprenda diferentes maneiras de selecionar seus dados hoje mesmo!
DataCamp Team's photo

DataCamp Team

7 min

tutorial

Tutorial de funções Python

Um tutorial sobre funções em Python que aborda como escrever funções, como chamá-las e muito mais!
Karlijn Willems's photo

Karlijn Willems

14 min

tutorial

Tutorial de junção de DataFrames no pandas

Neste tutorial, você aprenderá várias maneiras pelas quais vários DataFrames podem ser mesclados em python usando a biblioteca Pandas.
DataCamp Team's photo

DataCamp Team

19 min

tutorial

Tutorial de Python

Em Python, tudo é objeto. Números, cadeias de caracteres (strings), DataFrames, e até mesmo funções são objetos. Especificamente, qualquer coisa que você usa no Python tem uma classe, um modelo associado por trás.
DataCamp Team's photo

DataCamp Team

3 min

tutorial

Tutorial do For Loops em Python

Saiba como implementar For Loops em Python para iterar uma sequência ou as linhas e colunas de um dataframe do pandas.
Aditya Sharma's photo

Aditya Sharma

5 min

Ver maisVer mais