Direkt zum Inhalt

Wie man Spalten in Pandas fallen lässt Tutorial

Lerne, wie du Spalten in einem DataFrame von Pandas ablegen kannst.
Aktualisierte 16. Jan. 2025  · 3 Min. Lesezeit

Oft enthält ein DataFrame Spalten, die für deine Analyse nicht nützlich sind. Solche Spalten sollten aus dem DataFrame entfernt werden, damit du dich besser auf die übrigen Spalten konzentrieren kannst.

Die Spalten können entfernt werden, indem du Label-Namen und die entsprechende Achse angibst oder indem du Index- oder Spaltennamen direkt angibst. Wenn du einen Multi-Index verwendest, können Beschriftungen auf verschiedenen Ebenen entfernt werden, indem du die Ebene angibst.

.drop() Methode

Vergleichen wir die Anzahl der fehlenden Werte mit der Form des DataFrames. Du wirst feststellen, dass die Spalte county_name genauso viele fehlende Werte wie Zeilen enthält, was bedeutet, dass sie nur fehlende Werte enthält.

ri.isnull().sum()
state                            0
stop_date                        0
stop_time                        0
county_name                  91741
driver_gender                 5205
driver_race                   5202
...
ri.shape
91741, 15

Da sie keine nützlichen Informationen enthält, kann diese Spalte mit der Methode .drop() gelöscht werden.

Neben der Angabe des Spaltennamens musst du angeben, dass du aus der Spaltenachse löschst und dass der Vorgang an Ort und Stelle stattfinden soll, wodurch eine Zuweisungsanweisung wie unten gezeigt vermieden wird:

ri.drop('county_name',
  axis='columns', inplace=True)

.dropna() Methode

Die Methode .dropna() ist eine gute Möglichkeit, um Zeilen aufgrund fehlender Werte in dieser Zeile zu löschen.

Nehmen wir zum Beispiel an, dass die Spalten stop_date und stop_time für unsere Analyse entscheidend sind und dass eine Zeile ohne diese Daten für uns nutzlos ist.

ri.head()
    state   stop_date    stop_time    driver_gender   driver_race
0      RI  2005-01-04        12:55                M         White
1      RI  2005-01-23        23:15                M         White
2      RI  2005-02-17        04:15                M         White
3      RI  2005-02-20        17:15                M         White
4      RI  2005-02-24        01:20                F         White

Wir können Pandas anweisen, alle Zeilen zu löschen, in denen entweder in der Spalte stop_date oder stop_time ein Wert fehlt. Da wir eine Teilmenge angeben, berücksichtigt die Methode .dropna() nur diese beiden Spalten bei der Entscheidung, welche Zeilen weggelassen werden sollen.

ri.dropna(subset=['stop_date', 'stop_time'], inplace=True)

Interaktives Beispiel für das Fallenlassen von Spalten

In diesem Beispiel lässt du die Spalte county_name weg, weil sie nur fehlende Werte enthält, und die Spalte state, weil alle Verkehrskontrollen in einem Bundesstaat (Rhode Island) stattfanden. Diese Spalten können also weggelassen werden, weil sie keine nützlichen Informationen enthalten. Die Anzahl der fehlenden Werte in jeder Spalte wird für dich auf der Konsole ausgegeben.

  • Untersuche die .shape des DataFrame, um die Anzahl der Zeilen und Spalten herauszufinden.
  • Lösche die beiden Spalten county_name und state, indem du die Spaltennamen als Liste von Strings an die Methode .drop() übergibst.
  • Sieh dir die .shape noch einmal an, um zu sehen, dass es jetzt zwei Spalten weniger gibt.
# Examine the shape of the DataFrame
print(ri.shape)

# Drop the 'county_name' and 'state' columns
ri.drop(['county_name', 'state'], axis='columns', inplace=True)

# Examine the shape of the DataFrame (again)
print(ri.shape)

Wenn du den obigen Code ausführst, erhältst du das folgende Ergebnis:

(91741, 15)
(91741, 13)

Probiere es selbst aus.

Um mehr über das Fallenlassen von Spalten in Pandas zu erfahren, schau dir dieses Video aus unserem Kurs Einführung in die Datenvisualisierung mit ggplot2 an.

Dieser Inhalt stammt aus dem DataCamp-Kurs Einführung in die Datenvisualisierung mit ggplot2 von Kevin Markham.

Schau dir unser Pandas Add Column Tutorial an.

Themen

Pandas Kurse

Kurs

Introduction to Python

4 hr
6M
Master the basics of data analysis with Python in just four hours. This online course will introduce the Python interface and explore popular packages.
Siehe DetailsRight Arrow
Kurs starten
Mehr anzeigenRight Arrow
Verwandt

Der Blog

Lehrer/innen und Schüler/innen erhalten das Premium DataCamp kostenlos für ihre gesamte akademische Laufbahn

Keine Hacks, keine Tricks. Schüler/innen und Lehrer/innen, lest weiter, um zu erfahren, wie ihr die Datenerziehung, die euch zusteht, kostenlos bekommen könnt.
Nathaniel Taylor-Leach's photo

Nathaniel Taylor-Leach

4 Min.

Der Blog

2022-2023 DataCamp Classrooms Jahresbericht

Zu Beginn des neuen Schuljahres ist DataCamp Classrooms motivierter denn je, das Lernen mit Daten zu demokratisieren. In den letzten 12 Monaten sind über 7.650 neue Klassenzimmer hinzugekommen.
Nathaniel Taylor-Leach's photo

Nathaniel Taylor-Leach

8 Min.

Der Blog

Die 20 besten Snowflake-Interview-Fragen für alle Niveaus

Bist du gerade auf der Suche nach einem Job, der Snowflake nutzt? Bereite dich mit diesen 20 besten Snowflake-Interview-Fragen vor, damit du den Job bekommst!
Nisha Arya Ahmed's photo

Nisha Arya Ahmed

20 Min.

Der Blog

Q2 2023 DataCamp Donates Digest

DataCamp Donates hat im zweiten Quartal 2023 über 20.000 Stipendien an unsere gemeinnützigen Partner vergeben. Erfahre, wie fleißige benachteiligte Lernende diese Chancen in lebensverändernde berufliche Erfolge verwandelt haben.
Nathaniel Taylor-Leach's photo

Nathaniel Taylor-Leach

Der Blog

Die 32 besten AWS-Interview-Fragen und Antworten für 2024

Ein kompletter Leitfaden zur Erkundung der grundlegenden, mittleren und fortgeschrittenen AWS-Interview-Fragen, zusammen mit Fragen, die auf realen Situationen basieren. Es deckt alle Bereiche ab und sorgt so für eine abgerundete Vorbereitungsstrategie.
Zoumana Keita 's photo

Zoumana Keita

30 Min.

Der Blog

Top 30 Generative KI Interview Fragen und Antworten für 2024

Dieser Blog bietet eine umfassende Sammlung von Fragen und Antworten zu generativen KI-Interviews, die von grundlegenden Konzepten bis hin zu fortgeschrittenen Themen reichen.
Hesam Sheikh Hassani's photo

Hesam Sheikh Hassani

15 Min.

Mehr anzeigenMehr anzeigen