Kurs
Tortendiagramme sind eine der beliebtesten Darstellungen zur Visualisierung von Proportionen. Du kennst sie wahrscheinlich schon, aber wenn nicht, stell dir einfach einen großen Kuchen oder einen runden Schweizer Käse vor, der in verschieden große Scheiben geschnitten ist.
Python bietet mehrere Möglichkeiten, Kreisdiagramme zu erstellen. In diesem Lernprogramm zeigen wir dir, wie du mit Matplotlib und Pandas, zwei der beliebtesten Datenanalysepakete in Python, Tortendiagramme in Python erstellst. Wir werden den Artikel nach Methoden strukturieren, damit du dich auf den Ansatz und die Syntax konzentrieren kannst, die am besten zu deinem Arbeitsablauf passen.
Zusätzlich zu diesen Methoden geben wir dir einige Tipps, um die Fehlerbehebung, die Zugänglichkeit und die Benutzerfreundlichkeit von Kreisdiagrammen zu verbessern. Schließlich werden wir auch andere Diagrammalternativen in Betracht ziehen, die in bestimmten Szenarien besser geeignet sein können als Kreisdiagramme.
Wege zur Erstellung von Kreisdiagrammen in Python
Ich zeige dir zwei verschiedene Möglichkeiten, ein Python-Tortendiagramm zu erstellen, und du kannst selbst entscheiden, welche Methode du bevorzugst. Beides sind beliebte und gute Optionen, du kannst also nichts falsch machen.
Methode 1: Kreisdiagramme mit Matplotlib
Beginnen wir mit der Analyse, wie man ein Kreisdiagramm mit Matplotlib erstellt.
In diesem Abschnitt werden wir Daten zu den verschiedenen Kursen aus dem DataCamp-Kurskatalog analysieren, den du hier finden kannst. (Ich habe den Katalog durchgesehen und die Anzahl der Kurse in jeder Technologie gezählt und eine Tabelle mit diesen Informationen erstellt).
Wie man das Diagramm erstellt
Um unser erstes Kreisdiagramm mit Matplotlib zu erstellen, können wir die Funktion plt.pie()
verwenden. Wir verwenden eine Liste mit der Anzahl der verfügbaren Kurse für verschiedene Daten- und KI-Technologien (die jeweils die Keilgröße darstellen) sowie eine zweite Liste mit den Namen der Technologien, die über den Parameter labels
in das Diagramm aufgenommen werden. Alternativ können wir auch plt.legend()
verwenden, um eine eigene Legende hinzuzufügen.
Vergiss wie immer nicht, die plt.show()
am Ende deines Codes auszuführen, damit der Matplotlib-Plot korrekt angezeigt wird.
import pandas as pd
import matplotlib.pyplot as plt
courses = [164, 127, 31, 31,12, 11]
labels = ['Python','R','SQL','Power BI','Excel','ChatGPT']
dictionary = {'courses':courses, 'labels':labels}
python_pie_chart_df = pd.DataFrame(dictionary)
plt.pie(x = python_pie_chart_df.courses, labels = python_pie_chart_df.labels)
plt.show()
plt.pie(x = python_pie_chart_df.courses)
plt.legend(labels = python_pie_chart_df.labels, loc = [0.95,0.35])
plt.show()
Zusätzlich können wir auch den prozentualen Anteil der einzelnen Keile mit dem Parameter autopct
angeben. Im folgenden Beispiel geben wir die Größe der Keile mit einer Dezimalstelle an.
plt.pie(x = python_pie_chart_df.courses, labels = python_pie_chart_df.labels, autopct='%1.1f%%')
plt.show()
Wie du das Diagramm anpasst
Kreisdiagramme in Matplotlib sowie die Slices, aus denen sie bestehen, sind in hohem Maße anpassbar. Schauen wir uns einige der Optionen an, die die Funktion pie.plot()
bietet.
Um die Farbe der Slices zu ändern, können wir den Parameter colors
verwenden. Mit diesem Parameter wenden wir die Farbpalette von DataCamp auf unser Diagramm an.
datacamp_palette = ['#03ef62','#06bdfc','#ff6ea9','#ff931e','#ff5400','#7933ff']
plt.pie(x = python_pie_chart_df.courses, labels = python_pie_chart_df.labels, colors = datacamp_palette, autopct='%1.1f%%')
plt.show()
Sieht doch viel besser aus, oder? Aber es gibt noch viel mehr, was wir tun können, um unser Kreisdiagramm anzupassen. Wir können zum Beispiel mit den Parametern labeldistance
und pctdistance
mit dem Abstand der Beschriftungen und den Prozentsätzen spielen und mit dem Parameter startangle
einen Winkel für den Beginn des Slicings wählen.
plt.pie(x = python_pie_chart_df.courses, labels = python_pie_chart_df.labels, colors = datacamp_palette, autopct='%1.1f%%',
pctdistance= 0.8, labeldistance=1.1, startangle=180)
plt.show()
Stell dir vor, du hältst eine Präsentation und möchtest dich auf R-Kurse konzentrieren. Eine praktische Methode, um dies zu verdeutlichen, ist die Auflösung des Keils mit dem Parameter explode
, wie folgt:
explode = (0, 0.1, 0, 0, 0, 0) # only "explode" the 2nd slice (i.e. 'R')
plt.pie(x = python_pie_chart_df.courses, labels = python_pie_chart_df.labels,
colors = datacamp_palette, autopct='%1.1f%%',
pctdistance= 0.8, labeldistance=1.1,
startangle=180, explode=explode)
plt.show()
Wie man die Karte speichert
Nachdem du dein Tortendiagramm erstellt hast, kannst du es mit deinen Mitstreitern teilen. Dazu kannst du die Funktion plt.savefig()
verwenden, die den Dateinamen als Eingabe für die Funktion nimmt und dir ermöglicht, ihn in verschiedenen Formaten zu speichern, z. B. als .png, .jpg, .svg oder .pdf. Außerdem kannst du mit dpi
die Auflösung des Bildes ändern.
Hier ist ein Beispiel dafür, wie du dein Kreisdiagramm im .jpg-Format mit 200 Punkten pro Zoll speicherst.
plt.pie(x = df.courses, labels = df.labels,
colors = datacamp_palette, autopct='%1.1f%%',
pctdistance= 0.8, labeldistance=1.1,
startangle=180, explode=explode)
plt.savefig('demo.jpg', dpi =200)
Mehr darüber, wie du eine Visualisierung richtig speicherst, erfährst du in unserem Kurs Einführung in die Datenvisualisierung mit Matplotlib.
Methode 2: Kreisdiagramme mit Pandas
Da du nun weißt, wie du mit Matplotlib ein Tortendiagramm erstellen kannst, wollen wir sehen, wie es in Pandas funktioniert.
Wie man das Diagramm erstellt
Pandas hat eine plot()
Methode, mit der du verschiedene Arten von Plots zeichnen kannst. Diese Methode funktioniert sowohl mit DataFrame- als auch mit Series-Objekten in Pandas. Mit dem Argument kind
in der Methode plot()
kannst du die Art der Darstellung festlegen. In unserem Fall kannst du mit kind ='pie'
ein Tortendiagramm erstellen. Du kannst auch denParameter labels
hinzufügen, um jedem Keil einen Namen zu geben, und denParameter autopct
, um die Prozentsätze jedes Keils hinzuzufügen.
python_pie_chart_df['courses'].plot(kind='pie', labels=python_pie_chart_df['labels'], autopct='%1.1f%%')
plt.show()
Wie du das Diagramm anpasst
Die Methode plot()
von Pandas bietet ein Werkzeug zum schnellen Plotten, hat aber nur begrenzte Anpassungsmöglichkeiten. Glücklicherweise verwendet die Methode Matplotlib als Backend, d.h. du kannst die Matplotlib-Syntax auch außerhalb der Methode verwenden, um deine Visualisierung anzupassen. Unten findest du ein Beispiel, wie du Pandas und Matplotlib kombinieren kannst.
ax= python_pie_chart_df['courses'].plot(kind='pie', labels=python_pie_chart_df['labels'], autopct='%1.1f%%',
colors=datacamp_palette, figsize=(5,5))
ax.set_title('Pie Chart DatataCamp Courses')
ax.set_ylabel(None)
plt.show()
Wie man die Karte speichert
Das Speichern von Kreisdiagrammen in Pandas ist genau dasselbe wie in Matplotlib, da Pandas unter der Haube auf Matplotlib aufbaut.
ax= python_pie_chart_df['courses'].plot(kind='pie', labels=python_pie_chart_df['labels'], autopct='%1.1f%%',
colors=datacamp_palette, figsize=(5,5))
ax.set_title('Pie Chart DatataCamp Courses')
ax.set_ylabel(None)
plt.savefig('demo.png')
Fehlerbehebung bei Kreisdiagrammen
Damit deine Kreisdiagramme richtig angezeigt werden, musst du Matplotlib mit den richtigen Daten versorgen. Das bedeutet, dass du in deinem DataFrame immer Datenbereinigungstechniken anwenden solltest, z. B. das Löschen von Nullwerten mit pd.dropna()
und das Festlegen der richtigen Datentypen für deine Eingabespalten.
Darüber hinaus ist die Anpassung des Diagramms der Schlüssel zu einem überzeugenden und aussagekräftigen Kreisdiagramm. Bedenke jedoch, dass bei der Verwendung von Pandas erweiterte Anpassungen wie das Explodieren möglicherweise nicht unterstützt werden. Wie bereits erwähnt, musst du eventuell Matplotlib-Code in deine Skripte einfügen, wenn du mehr Kontrolle über dein Kreisdiagramm brauchst.
Verbesserung der Zugänglichkeit und Benutzerfreundlichkeit
Wenn du deine Kreisdiagramme anzeigst, solltest du dich an bewährte Verfahren halten.
- Beurteile dein Publikum: Als goldene Regel gilt, dass du dich immer in das Publikum einfühlen solltest, das du mit deiner Visualisierung ansprichst. Das bedeutet, dass du das Fachgebiet, das technische Wissen und die Interessen deines Publikums gut kennen musst.
- Räum das Durcheinander auf: Um unleserliche, unübersichtliche Visualisierungen zu vermeiden, solltest du dich fragen, ob das, was du einfügst, für dein Publikum relevant ist, und unnötige Elemente so weit wie möglich entfernen. Bei Kreisdiagrammen solltest du 3D-Effekte oder Schatten vermeiden, da sie die Interpretation erschweren können.
- Behalte die Schriftarten im Auge: Auch wenn es verlockend sein kann, verschiedene Schriftarten und -größen zu verwenden, gilt als Faustregel: Bleib bei einer Schriftart und höchstens drei verschiedenen Größen. Du solltest dich an die Schrifthierarchie halten und die Überschriften größer als den Text halten sowie eine fette Schrift verwenden, um wichtige Elemente und Überschriften hervorzuheben.
- Setze Farben kreativ ein: Farbe ist einer der auffälligsten Aspekte jeder Datenvisualisierung. Deshalb solltest du dir bei der Wahl des Farbschemas für deine Datenvisualisierung viele Gedanken machen. Das bedeutet, dass du eine einheitliche Farbpalette für deine Visualisierungen verwendest und Farben systematisch einsetzt, um zwischen Gruppen, Wichtigkeitsstufen und verschiedenen Arten von Informationshierarchien zu unterscheiden.
- Testen auf anderen Geräten: Es ist immer ratsam, dein Bildmaterial zu testen, um zu sehen, wie es auf verschiedenen Geräten aussieht.
Datenvisualisierung kann als eine Kunst angesehen werden. Intuition und guter Geschmack können den Unterschied ausmachen, aber du solltest immer auch die Theorie dahinter berücksichtigen. Wenn du mehr über die besten Methoden für eine effektive Datenvisualisierung wissen willst, schau dir unser Spickzettel für Data Storytelling & Kommunikation an. Wenn du mit Dashboards arbeitest, solltest du auch diesen Artikel über Best Practices für die Gestaltung von Dashboards lesen.
Alternativen zu Kreisdiagrammen
Um ehrlich zu sein, gehören Kreisdiagramme zu den am meisten kritisierten Darstellungen. Es ist erwiesen, dass Menschen nicht sehr gut darin sind, Winkel zu interpretieren. Wir können dies mit dem Tortendiagramm veranschaulichen, das wir zuvor verwendet haben. Betrachte die Schnitte von Excel und ChatGPT. Kannst du auf den ersten Blick erkennen, welcher den größten Winkel hat?
Deshalb empfehlen viele Datenvisualisierungsexperten, andere Diagramme zur Darstellung von Proportionen zu verwenden, vor allem, wenn es um viele Kategorien geht, wie z. B. Balkendiagramme und gestapelte Balkendiagramme, Baumdiagramme oder sogar Donut-Diagramme. Mehr über diese Alternativen erfährst du in unserem Artikel Arten von Datenplots und wie man sie in Python erstellt.
Fazit
Glückwunsch, dass du es bis zum Ende des Tutorials geschafft hast. Python ist eine sehr vielseitige Programmiersprache, die mehrere Bibliotheken und Ansätze zur Erstellung von Kreisdiagrammen bietet. In diesem Tutorial analysieren wir, wie man Tortendiagramme mit Matplotlib und Pandas erstellt. Beide sind gleichermaßen für den Job geeignet und haben bemerkenswerte Ähnlichkeiten. Die Idee ist, sich nicht für eine zu entscheiden, sondern sie je nach deinen Bedürfnissen und deinem Arbeitsablauf abwechselnd zu verwenden.
Wenn du mehr über Kreisdiagramme und allgemein über Datenvisualisierung in Python wissen willst, ist das DataCamp genau das Richtige für dich. Sieh dir unsere speziellen Materialien an und mach dich bereit, ein Visualisierungszauberer zu werden!
- Kurs Einführung in Python
- Lernpfad für Python-Entwickler
- Lernpfad zur Python-Programmierung
- Kurs Statistisches Denken in Python (Teil 1)

Ich bin freiberufliche Datenanalystin und arbeite mit Unternehmen und Organisationen auf der ganzen Welt an Data-Science-Projekten zusammen. Ich bin auch Ausbilder für Data Science mit mehr als 2 Jahren Erfahrung. Ich schreibe regelmäßig datenwissenschaftliche Artikel in englischer und spanischer Sprache, von denen einige auf etablierten Websites wie DataCamp, Towards Data Science und Analytics Vidhya veröffentlicht wurden. Als Datenwissenschaftlerin mit einem Hintergrund in Politik- und Rechtswissenschaften ist es mein Ziel, an der Schnittstelle von Politik, Recht und Technologie zu arbeiten und die Macht der Ideen zu nutzen, um innovative Lösungen und Erzählungen voranzutreiben, die uns dabei helfen können, dringende Herausforderungen wie die Klimakrise anzugehen. Ich betrachte mich als Autodidakt, der ständig lernt und ein überzeugter Verfechter der Multidisziplinarität ist. Es ist nie zu spät, neue Dinge zu lernen.
FAQs
Was ist ein Kreisdiagramm und wann sollte ich es verwenden?
Ein Tortendiagramm ist eine Art von Diagramm, bei dem ein Kreis in Sektoren unterteilt ist, die jeweils einen Anteil des Ganzen darstellen. Sie ist dann geeignet, um Proportionen darzustellen.
Wie kann ich ein Tortendiagramm in Matplotlib erstellen?
Der einfachste Weg, ein Tortendiagramm mit Matplotlib zu erstellen, ist die Funktion plt.pie()
, die mit verschiedenen Anpassungsparametern ausgestattet ist.
Wie kann ich ein Tortendiagramm in Pandas erstellen?
Der einfachste Weg, ein Tortendiagramm mit Matplotlib zu erstellen, ist die Methode Series.plot.(kind=’pie’)
. Es ermöglicht eine schnelle Visualisierung von Pandas DataFrames, hat aber im Vergleich zu Matplotlib nur begrenzte Anpassungsmöglichkeiten.
Was sind die besten Vorgehensweisen bei der Erstellung von Kreisdiagrammen?
Du solltest dich bei der Erstellung deiner Visualisierungen immer an bewährte Verfahren halten. Dazu gehört, dass du deine Kreisdiagramme so einfach wie möglich hältst, unnötige Elemente vermeidest, intuitive Farbpaletten wählst und die Darstellung auf deine Zielgruppe abstimmst.
Was sind die wichtigsten Einschränkungen von Kreisdiagrammen?
Menschen sind nicht besonders gut darin, Winkel zu interpretieren. Deshalb empfehlen viele Visualisierungsexperten, andere Diagramme zur Darstellung von Proportionen zu verwenden, z. B. Balkendiagramme.