Track
Wie man einen String in Python trimmt: Drei verschiedene Methoden
Das Trimmen von Text ist eine grundlegende Aufgabe bei der Verarbeitung von Textdaten in Python, vor allem in der Datenbereinigungs- und Vorbereitungsphase von Data-Science-Projekten. Durch das Trimmen werden unerwünschte Zeichen, wie z. B. Leerzeichen, am Anfang und Ende von Zeichenketten entfernt, wodurch deine Daten konsistenter und analysefähiger werden.
In diesem Lernprogramm lernst du die drei wichtigsten Methoden zum Trimmen von Zeichenketten in Python kennen: .strip()
, .lstrip()
, und .rstrip()
, und behandelt spezifische Anwendungsfälle, um ihre Vielseitigkeit und Nützlichkeit in realen Szenarien zu demonstrieren.
3 Methoden zum Trimmen eines Strings in Python
Python bietet integrierte Methoden zum Trimmen von Zeichenketten, mit denen du Textdaten ganz einfach bereinigen und vorverarbeiten kannst. Diese Methoden umfassen
.strip()
: Entfernt führende und nachgestellte Zeichen (standardmäßig Leerzeichen)..lstrip()
: Entfernt führende Zeichen (standardmäßig Leerzeichen) von der linken Seite des Strings..rstrip()
: Entfernt nachstehende Zeichen (standardmäßig Leerzeichen) von der rechten Seite des Strings.
Das Verständnis dieser Methoden ermöglicht eine effiziente Textmanipulation und -aufbereitung, die für jede Data Science-Aufgabe mit Textdaten entscheidend ist.
Entfernen von führenden und nachgestellten Leerzeichen aus Strings in Python mit .strip()
Die Methode .strip()
wurde entwickelt, um sowohl führende als auch nachgestellte Zeichen aus einer Zeichenkette zu entfernen. Sie wird am häufigsten verwendet, um Leerzeichen zu entfernen. Nachfolgend ein Beispiel, wenn es auf die Zeichenfolge angewendet wird " I love learning Python! ".
text = " I love learning Python! "
trimmed_text = text.strip()
print(trimmed_text) # Output: "I love learning Python!"
Diese Methode ist besonders nützlich für die Standardisierung von Zeichenketten, die unterschiedliche Mengen an führenden und nachfolgenden Leerzeichen enthalten können.
Führende Leerzeichen aus Strings in Python entfernen mit .lstrip()
Die Methode .lstrip()
zielt auf die linke Seite einer Zeichenkette und entfernt führende Zeichen. Standardmäßig werden Leerzeichen entfernt, aber du kannst auch festlegen, dass bestimmte Zeichen entfernt werden. Hier ist die Methode .lstrip(), die auf denselben String " I love learning Python! "
aus dem vorherigen Beispiel angewendet wird:
text = " I love learning Python! "
left_trimmed_text = text.lstrip()
print(left_trimmed_text) # Output: "I love learning Python! "
.lstrip()
ist nützlich, wenn du Zeichenketten bereinigen musst, die mit unerwünschten Leerzeichen oder Zeichen beginnen, z. B. in Namenslisten oder kategorischen Daten.
Entfernen von Leerzeichen am Ende von Strings in Python mit .rstrip()
Die Methode .rstrip()
ergänzt .lstrip()
, indem sie nachstehende Zeichen von der rechten Seite eines Strings entfernt. Sie teilt die Flexibilität, anzugeben, welche Zeichen entfernt werden sollen. Hier wird es auf das gleiche Beispiel wie oben angewendet:
text = " I love learning Python! "
right_trimmed_text = text.rstrip()
print(right_trimmed_text) # Output: " I love learning Python!"
Verwende .rstrip()
, wenn du mit Strings zu tun hast, die unerwünschte Zeichen oder Leerzeichen am Ende haben, z. B. Satzzeichen oder Anmerkungen am Ende.
Bestimmte Zeichen aus einer Zeichenkette in Python entfernen
Mit den Methoden zum Trimmen von Zeichenketten in Python kannst du festlegen, welche Zeichen am Anfang und am Ende einer Zeichenkette entfernt werden sollen. Diese Funktion erweitert die Methoden .strip()
, .lstrip()
und .rstrip()
um eine weitere Ebene der Flexibilität und ermöglicht gezieltere Stringbereinigungsoperationen.
Wie wir in unseren Beispielen sehen werden, ist es jedoch wichtig, die inhärenten Grenzen dieser Methoden zu kennen: Sie sind nicht in der Lage, Zeichen aus der Mitte von Zeichenketten zu entfernen oder komplexere musterbasierte Entfernungen durchzuführen. Für solche erweiterten Anforderungen bieten reguläre Ausdrücke (regex) eine robustere Lösung.
Bestimmte Zeichen aus einem String in Python mit .strip() entfernen
Beginnen wir mit der Methode .strip()
. Die Methode .strip() kann so angepasst werden, dass sie nicht nur Leerzeichen, sondern auch bestimmte Zeichen von beiden Enden einer Zeichenkette entfernt. Hier ist ein Beispiel:
text = "!!!I love learning Python!!!"
specific_char_trimmed = text.strip('!')
print(specific_char_trimmed) # Output: "I love learning Python"
Stellen wir uns nun vor, dass unser String tatsächlich "xxxyyy I love learning Python xxxyyy"
ist. Da ”xxx”
und ”yyy”
sowohl am Anfang als auch am Ende des Strings stehen, ist es möglich, beide zu entfernen, indem du das Zeichen 'xy
' als zu entfernendes Zeichen angibst. Hier ist es in Aktion!
text = "xxxyyy I love learning Python xxxyyy"
specific_chars_trimmed = text.strip('xy')
print(specific_chars_trimmed) # Output: " I love learning Python "
Wie bereits erwähnt, ist es wichtig zu wissen, dass .strip()
keine Zeichen aus der Mitte des Strings entfernen kann. Wenn der zu löschende Text beispielsweise "!!!I love learning!!! Python!!!"
ist, lautet die Ausgabe des obigen Vorgangs ”I love learning!!! Python”
. Für komplexere Entfernungsoperationen empfiehlt es sich, reguläre Ausdrücke anstelle der in diesem Lernprogramm beschriebenen Streifenmethoden zu verwenden.
Bestimmte Zeichen aus einem String in Python entfernen mit .lstrip()
und .rstrip()
Das Gleiche gilt für die Methoden .lstrip()
und .rstrip()
. Im Folgenden findest du Beispiele für das Entfernen bestimmter führender und nachfolgender Zeichen in .lstrip()
bzw. .rstrip()
:
text = "!!!I love learning Python!!!"
left_char_trimmed = text.lstrip('!')
print(left_char_trimmed) # Output: "I love learning Python!!!"
text = "!!!I love learning Python!!!"
right_char_trimmed = text.rstrip('!')
print(right_char_trimmed) # Output: "!!!I love learning Python"
Außerdem kann die gleiche Technik zum Entfernen mehrerer Zeichen auch auf .lstrip()
und .rstrip()
text = "xxxyyy I love learning Python xxxyyy"
left_chars_trimmed = text.lstrip('xy')
print(left_chars_trimmed) # Output: " I love learning Python xxxyyy"
text = "xxxyyy I love learning Python xxxyyy"
right_chars_trimmed = text.rstrip('xy')
print(right_chars_trimmed) # Output: "xxxyyy I love learning Python"
Fazit
Das Verständnis von String-Trimming und -Manipulation ist für eine effektive Python-Programmierung unerlässlich. Während die Methoden .strip()
, .lstrip()
und .rstrip()
die grundlegenden Anforderungen erfüllen, kann es für komplexere Szenarien notwendig sein, sich mit regulären Ausdrücken zu beschäftigen. Wenn du noch mehr lernen möchtest, solltest du dir unser Tutorial über reguläre Ausdrücke ansehen oder noch besser, den Skill Track Natural Language Processing in Python von DataCamp besuchen.
Adel ist Data Science Educator, Speaker und Evangelist bei DataCamp, wo er verschiedene Kurse und Live-Trainings zu Datenanalyse, maschinellem Lernen und Data Engineering veröffentlicht hat. Er setzt sich leidenschaftlich für die Verbreitung von Datenkenntnissen und Datenkompetenz in Organisationen und an der Schnittstelle zwischen Technologie und Gesellschaft ein. Er hat einen MSc in Data Science und Business Analytics. In seiner Freizeit ist er mit seinem Kater Louis unterwegs.
Lerne weiter Python!
Der Blog