Accéder au contenu principal

Trouver la taille d'un DataFrame en Python

Il existe plusieurs façons de déterminer la taille d'un DataFrame en Python pour répondre à différents besoins de codage. Consultez ce tutoriel pour apprendre rapidement à déterminer la taille d'un DataFrame. Ce didacticiel présente plusieurs façons de vérifier la taille d'un DataFrame, de sorte que vous trouverez certainement une méthode adaptée à vos besoins.
Actualisé 14 nov. 2024  · 5 min de lecture

Les DataFrame sont un type de données très utilisé dans les scripts Python. Comprendre la taille d'un DataFrame en Python est crucial pour de nombreuses raisons, notamment pour déterminer l'allocation de mémoire nécessaire lors de l'utilisation du DataFrame et pour s'assurer que votre script n'essaie pas d'appeler un élément en dehors des limites du DataFrame. Heureusement, il existe plusieurs façons de trouver la taille d'un DataFrame en Python, ce qui permet à un programmeur Python d'utiliser différentes méthodes pour s'adapter à différents styles de codage et à différentes situations.

Voyons comment trouver la taille d'un DataFrame en Python.

Comprendre les DataFrame de Python

Les DataFrame sont une manière d'organiser les informations en Python très répandue en science des données. Quelques éléments clés rendent les DataFrames exceptionnellement utiles dans les projets de données.

Tout d'abord, les informations contenues dans les DataFrame sont organisées comme un tableau, ce qui est facile à lire et à comprendre. Deuxièmement, les informations sont mutables, ce qui signifie que les éléments du DataFrame peuvent être modifiés après leur création. Vous pouvez facilement ajouter de nouveaux éléments ou mettre à jour ou supprimer des éléments existants dans un DataFrame.

Les DataFrame sont également utiles pour leur ordonnancement. Les éléments sont conservés dans le DataFrame dans l'ordre dans lequel ils ont été ajoutés, à moins qu'ils ne soient explicitement modifiés, par exemple par un tri.

Enfin, les DataFrame contiennent un index, à partir de 0, qui vous permet de sélectionner un élément individuel en fonction de sa position dans le DataFrame.

Vous pouvez en apprendre plus sur les DataFrames dans le cours Data manipulation with pandas de DataCamp ou dans ce tutoriel Python pandas.

DataFrame Python Taille : Utilisation de df.shape dans Pandas pour un usage général

Python pandas est une bibliothèque qui permet aux analystes de travailler facilement avec des DataFrame. Cette bibliothèque dispose d'une méthode de forme simple utilisée pour trouver la taille d'un DataFrame.

import pandas as pd

# Creating a sample DataFrame
df = pd.DataFrame({'Name': ['Alice', 'Bob', 'Charlie'],
                   'Age': [25, 30, 22],
                   'City': ['New York', 'San Francisco', 'Los Angeles']})

# Using shape to get the size
rows, columns = df.shape
print(f"Number of rows: {rows}, Number of columns: {columns}")
Output: Number of rows: 3, Number of columns: 3

La méthode df.shape permet d'obtenir rapidement et facilement des informations sur le nombre de lignes et de colonnes d'un DataFrame.

Principale leçon à retenir: df.shape est votre fonction de référence pour déterminer la taille d'un DataFrame.

Utilisation de len() pour le numéro de ligne uniquement

La fonction intégrée len(), l'une des méthodes les plus simples et les plus couramment utilisées pour déterminer la longueur d'une liste, peut également être utilisée pour déterminer le nombre de lignes d'un DataFrame. Cette méthode est concise et efficace. Cependant, elle fournit des informations limitées par rapport à la fonction df.shape.

import pandas as pd

# Creating a sample DataFrame
df = pd.DataFrame({'Name': ['Alice', 'Bob', 'Charlie'],
                   'Age': [25, 30, 22],
                   'City': ['New York', 'San Francisco', 'Los Angeles']})

# Using len to get the number of rows
num_rows = len(df)
print(f"Number of rows: {num_rows}")
Output: Number of rows: 3

Lorsqu'il s'agit de vérifier la longueur d'une liste en Python, len() est rarement utilisé par rapport à df.shape. Cependant, il peut s'agir d'un moyen rapide d'examiner le nombre de lignes dans un DataFrame sans avoir recours à la bibliothèque pandas.

Principale leçon à retenir: len() est une fonction intégrée qui peut être utilisée à la place de pandas.

df.info() pour des informations plus détaillées

Pour les situations où une mesure plus détaillée de la taille est nécessaire, essayez la méthode pandas df.info(). Cette approche vous fournit le nombre de lignes et de colonnes dans le DataFrame, ainsi que des informations sur le type de données dans chaque colonne et le nombre de valeurs nulles.

import pandas as pd

# Creating a sample DataFrame
df = pd.DataFrame({'Name': ['Alice', 'Bob', 'Charlie'],
                   'Age': [25, 30, 22],
                   'City': ['New York', 'San Francisco', 'Los Angeles']})

# Using info to get information about the DataFrame
df.info()
Output: 

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   Name    3 non-null      object
 1   Age     3 non-null      int64 
 2   City    3 non-null      object

dtypes: int64(1), object(2)
memory usage: 204.0+ bytes

Avec cette méthode, le nombre de lignes est indiqué sous RangeIndex. Dans l'exemple ci-dessus, il montre qu'il y a trois lignes (appelées ici entrées) et que l'index commence à 0 et se termine à 2. Le nombre de colonnes est indiqué en dessous. Ensuite, le nom de chaque colonne est indiqué, ainsi que le nombre d'entrées non nulles dans chaque colonne et son type de données.

Principale leçon à retenir: df.info() peut fournir des informations plus détaillées sur un DataFrame.

Meilleures pratiques et conseils sur la taille des DataFrame en Python

Lorsque vous recherchez la taille d'un DataFrame en Python, il y a quelques bonnes pratiques à garder à l'esprit.

  1. Choisissez la méthode qui convient le mieux à votre DataFrame. N'oubliez pas que df.shape indique rapidement le nombre de lignes et de colonnes, tandis que df.info fournit des informations supplémentaires dont vous n'avez pas forcément besoin.
  2. Assurez-vous d'avoir installé et importé toutes les bibliothèques dont vous avez besoin. La bibliothèque pandas est un élément essentiel lorsque vous travaillez avec des DataFrame.
  3. Documentez bien votre travail. Veillez à utiliser des commentaires descriptifs afin que les futurs codeurs puissent déchiffrer ce que vous avez fait et pourquoi.

Conclusion

Il existe plusieurs façons de trouver la taille d'un DataFrame en Python, en fonction de vos préférences et des exigences du code. Que vous ayez besoin de simplicité ou d'informations détaillées, il existe une approche qui répond à vos besoins spécifiques.

Tenez toujours compte de la nature de vos données et des informations que vous souhaitez obtenir lorsque vous déterminez l'approche à utiliser. Pour en savoir plus sur l'utilisation des DataFrames Python, consultez le cours Introduction à Python de DataCamp ou le cours Python intermédiaire pour la finance. Ou essayez le cursus de data scientist en Python de DataCamp.

Vous pouvez également consulter polars, un nouveau concurrent de pandas pour l'analyse de DataFrame haute performance. Vous pouvez en savoir plus sur la différence entre les pandas et les polars ou découvrir une introduction à l'utilisation des polars.


Amberle McKee's photo
Author
Amberle McKee
LinkedIn

Je suis titulaire d'un doctorat et j'ai 13 ans d'expérience dans le traitement des données dans un environnement de recherche biologique. Je crée des logiciels dans plusieurs langages de programmation, notamment Python, MATLAB et R. Je suis passionné par le partage de mon amour de l'apprentissage avec le monde.

Sujets

Continuez à apprendre Python ! 

cursus

Python Data Fundamentals

30hrs hr
Grow your data skills, discover how to manipulate and visualize data, and apply advanced analytics to make data-driven decisions.
Afficher les détailsRight Arrow
Commencer le cours
Voir plusRight Arrow
Apparenté

blog

2022-2023 Rapport annuel DataCamp Classrooms

À l'aube de la nouvelle année scolaire, DataCamp Classrooms est plus motivé que jamais pour démocratiser l'apprentissage des données, avec plus de 7 650 nouveaux Classrooms ajoutés au cours des 12 derniers mois.
Nathaniel Taylor-Leach's photo

Nathaniel Taylor-Leach

8 min

blog

Les 20 meilleures questions d'entretien pour les flocons de neige, à tous les niveaux

Vous êtes actuellement à la recherche d'un emploi qui utilise Snowflake ? Préparez-vous à répondre à ces 20 questions d'entretien sur le flocon de neige pour décrocher le poste !
Nisha Arya Ahmed's photo

Nisha Arya Ahmed

20 min

blog

Q2 2023 DataCamp Donates Digest

DataCamp Donates a offert plus de 20k bourses d'études à nos partenaires à but non lucratif au deuxième trimestre 2023. Découvrez comment des apprenants défavorisés et assidus ont transformé ces opportunités en réussites professionnelles qui ont changé leur vie.
Nathaniel Taylor-Leach's photo

Nathaniel Taylor-Leach

blog

Les 32 meilleures questions d'entretien sur AWS et leurs réponses pour 2024

Un guide complet pour explorer les questions d'entretien AWS de base, intermédiaires et avancées, ainsi que des questions basées sur des situations réelles. Il couvre tous les domaines, garantissant ainsi une stratégie de préparation bien équilibrée.
Zoumana Keita 's photo

Zoumana Keita

30 min

blog

Nous avons fait don de bourses DataCamp Premium à un million de personnes, et ce n'est pas fini.

Réparties entre nos deux programmes d'impact social, DataCamp Classrooms et #DCDonates, les bourses offrent un accès illimité à tout ce que DataCamp Premium a à offrir.
Nathaniel Taylor-Leach's photo

Nathaniel Taylor-Leach

blog

Célébration de Saghar Hazinyar : Une boursière de DataCamp Donates et une diplômée de Code to Inspire

Découvrez le parcours inspirant de Saghar Hazinyar, diplômée de Code to Inspire, qui a surmonté les défis en Afghanistan et s'est épanouie grâce à une bourse de DataCamp Donates.
Fereshteh Forough's photo

Fereshteh Forough

4 min

Voir plusVoir plus