Kurs
Wie man Jupyter Notebooks benutzt: Der ultimative Leitfaden
Jupyter-Notebooks sind Dokumente für technische und datenwissenschaftliche Inhalte. Dieses Tutorial gibt einen Überblick über Jupyter-Notebooks, ihre Komponenten und ihre Verwendung.
Wir werden Notebooks mithilfe von DataLab erkunden, einem gehosteten Notebook-Service, der alle Funktionen von Jupyter-Notebooks sowie Funktionen für die Verbindung mit Datenbanken, die Zusammenarbeit in Echtzeit und die Veröffentlichung deiner Arbeit bietet.
Dieses Tutorial setzt voraus, dass du bereits eine Data Science-Programmiersprache wie Python, SQL, R oder Julia verwendet hast.
Übersicht der Notizbücher
Notizbücher fassen Computercode (z. B. Python, SQL oder R), die Ergebnisse der Ausführung des Codes und Rich-Text-Elemente (Formatierungen, Tabellen, Abbildungen, Gleichungen, Links usw.) in einem einzigen Dokument zusammen.
Der größte Vorteil von Notizbüchern ist die Möglichkeit, deinen Code mit Kommentaren zu versehen. Das bedeutet, dass du den fehleranfälligen Prozess des Kopierens und Einfügens von Analyseergebnissen in einen separaten Bericht vermeiden kannst. Stattdessen mischst du deine Analyse einfach mit dem Berichtstext im Notizbuch.
Wer sollte Jupyter Notebooks benutzen?
Jupyter Notebooks werden vor allem von Datenexperten verwendet, insbesondere von Datenanalysten und Datenwissenschaftlern. Laut den Ergebnissen der Kaggle-Umfrage 2022 sind Jupyter Notebooks die beliebteste Data Science IDE, die von über 80 % der Befragten genutzt wird.
Arten von Jupyter Notebook
Es gibt zwei Haupttypen von Jupyter-Notebooks: gehostete und lokale Notebooks. DataCamp bietet DataLab an, ein gehostetes Jupyter-Notebook, das wir für den Großteil dieses Tutorials verwenden werden. DataLab ist eine hervorragende Option für Lernende und Berufstätige, die keine lokale Umgebung einrichten möchten.
Wenn nicht anders angegeben, funktionieren die in diesem Tutorial beschriebenen Funktionen auch mit anderen Jupyter-Notebook-Versionen. Wenn du es vorziehst, eine lokale Umgebung zu verwenden, kannst du Jupyter Notebook mit unserem Tutorial Jupyter Notebook installieren auf deinem Rechner installieren. Marcus Schanta pflegt eine Liste mit anderen gehosteten Notebook-Plattformen.
Bestandteile eines Notizbuchs
Ein Jupyter Notebook besteht aus drei Hauptkomponenten: Zellen, einer Laufzeitumgebung und einem Dateisystem.
Zellen sind die einzelnen Einheiten des Notizbuchs, die entweder Text oder Code enthalten können:
- Textzellen werden zum Schreiben von erzählendem Text verwendet und enthalten Bilder, Links und Gleichungen.
- Die Textzellen sind in Markdown geschrieben, einer einfachen Auszeichnungssprache.
- Codezellen werden zum Schreiben und Ausführen von Code verwendet.
- Die Ausgabe von Codezellen wird direkt unter der Codezelle angezeigt.
- SQL-Zellen (nur DataLab) werden verwendet, um SQL-Abfragen auszuführen, d.h. du kannst ganz einfach Daten aus einer Datenbank abrufen.
- Diagrammzellen (nur DataLab) können verwendet werden, um Visualisierungen zu erstellen und Pandas DataFrames schnell zu visualisieren.
Die Laufzeitumgebung ist für die Ausführung des Codes im Notizbuch verantwortlich. Die Laufzeitumgebung kann so konfiguriert werden, dass sie verschiedene Sprachen unterstützt, darunter Python, R oder SQL.
Mit dem Dateisystem kannst du Datendateien, Codedateien und Ergebnisse deiner Analyse hochladen, speichern und herunterladen.
Befehlsmodus und Bearbeitungsmodus
Jupyter-Notebooks haben zwei verschiedene Interaktionsmodi: den Befehlsmodus und den Bearbeitungsmodus. Im Befehlsmodus kannst du zwischen Zellen navigieren, Zellen hinzufügen und löschen und den Zellentyp ändern. Im Bearbeitungsmodus kannst du den Inhalt einer Zelle bearbeiten.
Um in den Befehlsmodus zu gelangen, kannst du entweder Escape drücken oder außerhalb einer Zelle klicken. Um in den Bearbeitungsmodus zu gelangen, kannst du die Eingabetaste drücken oder in eine Zelle klicken.
In DataLab kannst du auf die Schaltflächen "Text hinzufügen" oder "Code hinzufügen" klicken, um eine neue Zelle hinzuzufügen.
Hilfe bekommen
Für das Jupyter-Notebook kannst du Hilfe in der Dokumentation oder über die Option im Menü erhalten. In DataLab kannst du schnell auf die Hilfe und die Tastaturkürzel zugreifen, indem du im Menü auf die Schaltfläche Hilfe drückst.
Text schreiben
Die Textzellen sind in der Auszeichnungssprache Markdown geschrieben, mit der du ganz einfach Text schreiben und formatieren kannst. Im Bearbeitungsmodus kannst du eine Syntax wie ** ** für Fettdruck verwenden oder die Schaltflächen benutzen, um deinen Text zu formatieren.
Hier sind ein paar verschiedene Optionen:
Wenn du die Umschalttaste + Eingabe oder die Schaltfläche "Ansicht" drückst, wird die Zelle ausgeführt und du erhältst das folgende Ergebnis.
- Zeilen, die mit # beginnen, sind eine Überschrift der obersten Ebene. Beginne mit ## für eine Überschrift der zweiten Ebene, ### für eine Überschrift der dritten Ebene, und so weiter.
- Umgib den Text mit **, um ihn fett zu machen, __, um ihn kursiv zu machen, und `, um ihn mit Code zu formatieren.
- Beginne aufeinanderfolgende Zeilen mit -, um sie zu einer Aufzählung zu machen.
- Beginne die Zeilen mit Zahlen, gefolgt von einem Punkt, um sie zu einer nummerierten Liste zu machen.
- Hyperlinks werden in zwei Teilen geschrieben. Der anzuzeigende Text wird von eckigen Klammern umgeben, die URL wird in Klammern gesetzt.
Code schreiben und ausführen
Wenn du "Code hinzufügen" drückst oder einen Befehl mit (Escape) eingibst und "B" drückst, wird ein neuer Codeblock hinzugefügt.
Schreibe den Code in die Zelle, wie du es in einem Skript tun würdest.
Wenn du Run oder CTRL/CMD+Enter drückst, wird der Code ausgeführt und seine Ausgabe angezeigt.
Dateien lesen und schreiben
Wenn du im linken Menü auf "Dateien durchsuchen und hochladen" klickst, wird das Dateisystem geöffnet und du kannst eine Datei von deinem lokalen Rechner hochladen, indem du auf das Plus drückst. Unten haben wir eine einfache Textdatei namens hello_world.txt hochgeladen.
Wir können den folgenden Code verwenden, um die Datei zu öffnen, etwas Text hinzuzufügen und dann eine neue Datei zu speichern.
Du siehst jetzt die neue Datei im Dateisystem, die unsere Aktualisierungen enthält.

Arbeiten mit dem Dateisystem
Wir haben gezeigt, wie man eine Datei hochlädt, aktualisiert und neu erstellt. Um die neue Datei herunterzuladen, drückst du auf die drei Punkte im Dateisystem und dann auf Download.
Mit dem Plus-Button, der zum Erstellen neuer Dateien verwendet wird, kannst du auch neue Notizbücher erstellen, die dann keine Zellen oder Ausgaben haben.
Zellen befehligen
Mit den Schaltflächen "Nach oben" und "Nach unten" kannst du die Zellen schnell neu anordnen, wie in der folgenden Abbildung gezeigt.
Dadurch wird dein Code neu geordnet. (Beachte, dass dein Code kaputt gehen kann, wenn du versuchst, ihn in der falschen Reihenfolge auszuführen!)
Die Schaltfläche Code ausblenden blendet den Code ein und aus; das ist nützlich für sehr lange Codeblöcke, an denen du gerade nicht arbeitest. Sie ist auch nützlich, wenn die Leser deiner Analyse sich nicht für die technischen Details interessieren und nur die Ergebnisse sehen wollen.
Mit der Schaltfläche Ausgabe ausblenden kannst du auch lange Ausgaben ausblenden.
Schaltflächen können auch zusammen verwendet werden, um sowohl den Code als auch die Ausgabe auszublenden.
Berichte veröffentlichen (nur DataLab)
DataLab ermöglicht es dir, deine Notizbücher als Publikationen zu veröffentlichen. Das ist eine tolle Möglichkeit, deine hervorragende Arbeit zu präsentieren und mit anderen Datenwissenschaftlern zusammenzuarbeiten.
Du kannst dein Notizbuch veröffentlichen, indem du auf die Schaltfläche "Veröffentlichen" im Seitenmenü klickst. Klicke dann auf "Veröffentlichen", um dein Notizbuch zu teilen. Es ist eine gute Idee, das Notizbuch vor der Veröffentlichung von oben nach unten durchzugehen. Das hilft bei der Überprüfung deines Codes und stellt sicher, dass er lesbar ist, da die meisten Menschen von oben nach unten lesen.
Sobald dein Notizbuch veröffentlicht wurde, können andere Nutzer die Veröffentlichung einsehen und einzelne Zellen kommentieren. Das Gleiche kannst du auch für andere tun. Das ist eine gute Möglichkeit, um eine Diskussion zu eröffnen oder einen komplexen Code zu verstehen. Hier ist ein Beispiel für einen Arbeitsplatz:

Jupyter-Notebooks teilen (nur DataLab)
Die gemeinsame Nutzung von Arbeitsmappen ist eine weitere nützliche Funktion, die es nur in DataLab gibt. Da das Notebook gehostet wird, kannst du einen öffentlichen oder privaten, zugangskontrollierten Link freigeben, den der Empfänger selbst ausführen kann.
Das ist eine fantastische Möglichkeit, zusammenzuarbeiten. Data Science ist ein tiefes und weites Feld, was bedeutet, dass von einer einzelnen Person nicht erwartet wird, dass sie alles weiß. Data Scientists müssen zusammenarbeiten, um die besten Ergebnisse zu erzielen, egal ob es sich um effizienten Code, überzeugende Visualisierungen oder ein genaues Modell handelt. DataLab ermöglicht eine Zusammenarbeit in Echtzeit, bei der mehrere Personen gleichzeitig ein Notizbuch bearbeiten können.
Um dein Notizbuch zu teilen, drückst du auf den Teilen-Button oben rechts. Hier kannst du den Link kopieren, das Notizbuch privat/öffentlich machen und festlegen, wer auf das Notizbuch zugreifen darf (wenn es privat ist).
Nimm es auf die nächste Stufe
Beginne deine Data Science-Reise noch heute, indem du dich kostenlos bei DataLab anmeldest. Wenn du nicht weiterkommst, findest du in der DataLab-Dokumentation weitere Informationen.
Erfahre mehr über Python
Kurs
Einführung in die Datenwissenschaft in Python
Kurs