Delta Lake: Eine praktische Einführung mit praxisnahen Beispielen

Lerne die Grundlagen von Delta Lake, von der Einrichtung bis hin zu fortgeschrittenen Funktionen wie Zeitreisen und Schema-Evolution, anhand von PySpark-Beispielen.

Aktualisierte 12. Feb. 2025 · 9 Min. Lesezeit

Data Lakes sind der Goldstandard für die Speicherung großer Mengen strukturierter und unstrukturierter Daten, haben aber oft mit Dateninkonsistenz, Schemaentwicklung und Leistungsproblemen zu kämpfen. Delta Lake löst diese Herausforderungen, indem es ACID-Transaktionen, Schemadurchsetzung und skalierbare Datenverarbeitungauf Apache Spark aufbaut.

In diesem Tutorial erkläre ich dir die Grundlagen von Delta Lake, einschließlich der Architektur, der Funktionen und der Einrichtung, sowie praktische Beispiele, die dir den Einstieg erleichtern.

Was ist der Deltasee?

Delta Lake ist eineOpen-Source-Speicherschicht, die für die Integration mit Apache Spark entwickelt wurde und damit eine bevorzugte Lösung für Teams ist, die das Spark-Ökosystem nutzen. Es führt ACID-Transaktionen (Atomicity, Consistency, Isolation, Durability) in Big-Data-Umgebungen ein.

Durch robustes Metadatenmanagement, Versionskontrolle und Schemaerzwingung verbessert Delta Lake Data Lakehouses und gewährleistet eine hohe Datenqualität für Analysen und maschinelle Lernprozesse.

Merkmale des Deltasees

ACID-Transaktionen: Gewährleistet einen zuverlässigen und konsistenten Datenbetrieb.
Durchsetzung und Entwicklung von Schemata: Verhindert Schemafehlanpassungen und ermöglicht schrittweise Aktualisierungen.
Zeitreisen: Ermöglicht die Abfrage früherer Versionen von Daten.
Optimierte Metadatenverwaltung: Verbessert die Abfrageleistung.
Skalierbarkeit für Batch- und Streaming-Workloads: Unterstützt Stapelverarbeitung und Echtzeit-Streaming-Analysen.

Architektur am Deltasee

Delta Lake verbessert die traditionellen Datenarchitekturen, insbesondere die Lambda-Architektur, indem es Batch- und Streaming-Datenverarbeitung in einem einzigen, ACID-kompatiblen Framework vereint.

Datenplattformen, die Delta Lake nutzen, folgen in der Regel einer Medaillon-Architekturdie unsere Daten in drei logischen Schichten organisiert, die wie folgt definiert sind:

Tabellen aus Bronze: Ingestion von Rohdaten aus verschiedenen Quellen (RDBMS, JSON-Dateien, IoT-Daten usw.), die als unveränderliche Quelle der Wahrheit dienen.
Silberne Tabellen: Eine verfeinerte Sicht auf Daten durch Deduplizierung, Transformationen und Joins.
Gold Tabellen: Aggregierte Einblicke auf Unternehmensebene für Dashboarding-, Berichts- oder Machine Learning-Anwendungen.

Gold-Tabellen können von Business Intelligence-Tools genutzt werden, um Echtzeit-Analysen zu ermöglichen und die Entscheidungsfindung zu unterstützen.

Die Medaillon-Architektur. Bildquelle: Databricks

Delta Lake File Format

Delta Lake basiert auf Apache Parquet, einemar Speicherformat, das effiziente Abfragen, Komprimierung und Schemaentwicklung ermöglicht. Was Delta Lake jedoch von den standardmäßigen Parquet-basierten Data Lakes unterscheidet, ist das DeltaLog, ein Transaktionsprotokoll, daseine Historie aller an einem Datensatz vorgenommenen Änderungen speichert.

Zu den wichtigsten Komponenten des Delta Lake-Dateiformats gehören:

Transaktionsprotokoll (_delta_log/ ):

Eine strukturierte Folge von JSON- und Checkpoint-Dateien, die alle Änderungen (Einfügungen, Aktualisierungen und Löschungen) in einer Delta-Tabelle aufzeichnen.
Gewährleistet ACID-Transaktionen und ermöglicht Rollback, Zeitreisen und Versionskontrolle.

Datendateien (Parkettformat):

Delta Lake speichert Daten in Parquet-Dateien, aber das Transaktionsprotokoll verfolgt Metadaten über Dateiversionen und Änderungen.
Im Gegensatz zu herkömmlichen Parkettdateien unterstützen Delta-Tabellen Aktualisierungs-, Lösch- und Zusammenführungsoperationen (was bei Standard-Parkett nicht möglich ist).

Kontrollpunkte:

Delta Lake komprimiert JSON-Transaktionsprotokolle in regelmäßigen Abständen in binäre Checkpoint-Dateien, um die Abfrageleistung zu verbessern.
Diese Checkpoints helfen dabei, die Metadatensuche zu beschleunigen und verhindern, dass die Leistung mit der Zeit nachlässt.

Wie du siehst, fehlt es den standardmäßigen Parquet-basierten Data Lakes ohne DeltaLog an ACID-Transaktionen und sie können nicht sicher mit gleichzeitigen Änderungen umgehen. Das Dateiformat von Delta Lake ermöglicht die Koexistenz von Streaming und Stapelverarbeitung bei gleichzeitiger Wahrung der Konsistenz. Und schließlich machen Funktionen wie Merge-on-Read, Verdichtung und optimierte Metadatenabfragen Delta-Tabellen äußerst effizient für umfangreiche Analysen.

Einrichtung des Deltasees

Los geht's mit der Einrichtung von Delta Lake! Ich werde es in zwei einfache Schritte unterteilen:

Schritt 1: Apache Spark und Delta Lake installieren

Um loszulegen, musst du sicherstellen, dass du eine Apache Spark-Umgebung hast. Dann installiere die

Delta Lake Paket (wenn du Python verwendest) mit folgendem Befehl:

pip install pyspark delta-spark

Mit dem obigen Befehl wird das Paket delta-spark installiert, das deine Spark-Sitzung mit den notwendigen Delta Lake-Integrationen ausstattet.

Schritt 2: Delta Lake mit Spark konfigurieren

Nach der Installation des Pakets konfigurierst du deine Spark-Sitzung für die Verwendung von Delta Lake mit

diese Einstellungen:

from pyspark.sql import SparkSession

# Initialize a SparkSession with Delta support
spark = SparkSession.builder \
    .appName("DeltaLakePractice") \
    .config("spark.sql.extensions", "io.delta.sql.DeltaSparkSessionExtension") \
    .config("spark.sql.catalog.spark_catalog", "org.apache.spark.sql.delta.catalog.DeltaCatalog") \
    .getOrCreate()

# Check if Spark is working
print("Spark Session Created Successfully!")

Hier wird die Spark-Sitzung mit zwei wichtigen Konfigurationen eingerichtet. Die erste ermöglicht

Delta Lake SQL-Erweiterungen und die zweite definiert Delta Lake als Standard

Katalog, um sicherzustellen, dass deine Daten im Delta-Format korrekt verarbeitet werden.

Grundlagen des Deltasees

Kommen wir nun zu den Grundlagen. Mit Delta Lake kannst du ACID-konforme Tabellen mithilfe einer einfachen DataFrame-API erstellen.

Schritt 1: Erstellen einer Delta-Tabelle

Erstelle eine Delta-Tabelle, indem du einen DataFrame im Delta-Format ausschreibst:

# Sample DataFrame creation
data = [("Alice", 34), ("Bob", 45), ("Cathy", 29)]
columns = ["name", "age"]
df = spark.createDataFrame(data, columns)

# Save the DataFrame as a Delta table (overwrite mode replaces any existing data)
df.write.format("delta").mode("overwrite").save("/path/to/delta/table")

Der obige Codeschnipsel erstellt einen einfachen DataFrame und schreibt ihn im Delta-Format in einen bestimmten Pfad. Durch die Verwendung von mode("overwrite") wird sichergestellt, dass alle vorhandenen Daten ersetzt werden.

Schritt 2: Lesen aus einer Delta Tabelle

Sobald eine Delta-Tabelle erstellt ist, kannst du ihre Daten wie folgt lesen:

# Load the Delta table from a specified path
delta_df = spark.read.format("delta").load("/path/to/delta/table")
delta_df.show()

Der obige Ausschnitt lädt die Delta-Tabelle in einen DataFrame und zeigt ihren Inhalt mit der Methode show() an, um zu bestätigen, dass die Daten korrekt gelesen wurden.

Schritt 3: Schreiben in eine Delta-Tabelle (Anhängen und Überschreiben)

Delta Lake unterstützt mehrere Schreibmodi, mit denen du schrittweise neue Datensätze hinzufügen (append) oder bestehende Daten ersetzen (overwrite) kannst, während die ACID-Garantien erhalten bleiben.

Daten anhängen

Neue Daten an eine bestehende Delta-Tabelle anhängen:

# New data to append
new_data = [("David", 40)]
new_df = spark.createDataFrame(new_data, columns)

# Append data to the existing Delta table
new_df.write.format("delta").mode("append").save("/path/to/delta/table")

Der Modus "append" wird verwendet, um der Tabelle neue Zeilen hinzuzufügen, ohne die bestehenden Daten zu verändern.

Überschreiben von Daten

Überschreibe die gesamte Delta Tabelle mit aktualisierten Daten:

# Updated data for overwrite
updated_data = [("Alice", 35), ("Bob", 46), ("Cathy", 30)]
updated_df = spark.createDataFrame(updated_data, columns)

# Overwrite the current contents of the Delta table
updated_df.write.format("delta").mode("overwrite").save("/path/to/delta/table")

Im Modus "overwrite" wird der Inhalt der Delta-Tabelle vollständig durch den neuen aktualisierten DataFrame.

Delta Lake Erweiterte Funktionen

Dieser Abschnitt behandelt einige der leistungsstarken Funktionen von Delta Lake, die über die Grundfunktionen hinausgehen.

Wir werden insbesondere untersuchen, wie du auf frühere Versionen deiner Daten zurückblicken, Schemaänderungen automatisch verwalten und Transaktionen mit mehreren Operationen atomar durchführen kannst.

Zeitreise (Abfrage älterer Versionen von Daten)

Mit der Zeitreisefunktion von Delta Lake kannst du auf frühere Versionen deiner Tabelle zugreifen. Jeder Schreibvorgang auf eine Delta-Tabelle erzeugt eine neue Version, so dass du einen früheren Stand deiner Daten abfragen kannst. Ich habe diese Funktion genutzt, um Datenänderungen zu überprüfen, Probleme zu beheben oder einen früheren Snapshot wiederherzustellen, wenn etwas schief gelaufen ist.

# Querying an earlier version (version 0) of the Delta table:
historical_df = spark.read.format("delta") \
    .option("versionAsOf", 0) \
    .load("/path/to/delta/table")
historical_df.show()

Entwicklung und Durchsetzung von Schemata

Wenn sich die Datensätze weiterentwickeln, können neue Spalten hinzugefügt werden. Delta Lake kanndas Schema automatischweiterentwickeln, indem es neue Felder in eine bestehende Tabelle einfügt und gleichzeitig die Konsistenzder Daten gewährleistet . Das bedeutet, dass du deine Tabelle nicht neu erstellen oder manuell anpassen musst, wenn sich deine Datenstruktur ändert.

Fügen wir Daten mit einem aktualisierten Schema hinzu, indem wir die automatische Schemaentwicklung nutzen:

# Create a DataFrame with an additional "country" column:
new_data = [("Alice", 34, "USA"), ("Bob", 45, "Canada")]
columns = ["name", "age", "country"]
new_df = spark.createDataFrame(new_data, columns)

# Append the new data to the Delta table with schema evolution enabled:
new_df.write.format("delta") \
    .mode("append") \
    .option("mergeSchema", "true") \
    .save("/path/to/delta/table")

Hier enthält der DataFrame new_df eine zusätzliche Spalte, country. Mit option("mergeSchema", "true") aktualisiert die Delta Lake-Engine automatisch das Schema der Tabelle, um die neue Spalte aufzunehmen und die Daten sicheranzuhängen !

Delta Lake Transaktionen (ACID)

Die ACID-Transaktionen von Delta Lake garantieren, dass komplexe Operationen zuverlässig ausgeführt werden - auch bei hoher Parallelität. Das bedeutet, dass eine Reihe von Vorgängen (z. B. Aktualisierungen und Einfügungen) als eine Einheit behandelt werden. Wenn ein Teil der Transaktion fehlschlägt, werden keine Änderungen vorgenommen, damit deine Daten konsistentbleiben .

Lass uns eine atomare Transaktion mit einer MERGE Operation durchführen:

-- Execute a MERGE statement in SQL to update or insert data atomically:
MERGE INTO delta./path/to/delta/table AS target
USING (SELECT 'Alice' AS name, 35 AS age, 'USA' AS country) AS source
ON target.name = source.name AND target.country IS NULL
WHEN MATCHED THEN 
   UPDATE SET target.age = source.age, target.country = source.country
WHEN NOT MATCHED THEN 
   INSERT (name, age, country) VALUES (source.name, source.age, source.country)

Im obigen Beispiel sucht die Anweisung MERGE nach Zeilen in der Zieltabelle, in denen der Name übereinstimmt und das Länderfeld NULL ist. Wenn eine Übereinstimmung gefunden wird, wird dieZeile aktualisiert; andernfalls wird ein neuer Datensatz eingefügt .

Beachte, dass die Bedingung target.country IS NULL dazu führen kann, dass eine neue Zeile eingefügt wird, obwohl es bereits eine Zeile für "Alice" in der Tabelle gibt, anstatt eine Zeile mit einem Nicht-Null-Land zu aktualisieren. Dieses Beispiel zeigt, wie wichtig es ist, die Abgleichskriterien für Transaktionen sorgfältig zu definieren.

Bewährte Praktiken für die Nutzung des Deltasees

Hier sind die besten Praktiken, die ich bei der Arbeit mit Delta Lake befolge. Diese können dir helfen, effiziente, wartbare Datenpipelines aufzubauen.

Effiziente Datenpartitionierung

Die Partitionierung deiner Delta-Tabellen kann die Abfrageleistung erheblich verbessern, wenn du mit großen Datenmengen.

Tipp: Wenn du deinen DataFrame schreibst, verwende die Option .partitionBy("column_name") , um deine Daten in kleinere, besser handhabbare Teile zu zerlegen (z. B. nach Datum oder Kategorie). Dieser Ansatz reduziert die Menge der Daten, die bei typischen Abfragen durchsucht werden.

Verwaltung von Metadaten mit Delta Lake

Delta Lake verwendet ein Transaktionsprotokoll (das _delta_log), um Metadaten für alle Operationen auf deiner Tabelle.

Tipp: Planen Sie regelmäßige Wartungsarbeiten (z. B. den Befehl VACUUM ), um veraltete Datendateien zu entfernen und die Metadaten zu optimieren. Dies führt zu einer schnelleren Abfrageleistung und einer einfacheren Verwaltung großer Datensätze.

Optimierung der Leistung mit Z-Ordering

Z-Ordering ist eine Datenclustertechnik, die die Daten auf der Festplatte organisiert, um die Abfrageeffizienz zu verbessern, insbesondere wenn nach bestimmten Spalten gefiltert wird:

OPTIMIZE delta./path/to/delta/table
ZORDER BY (name, age);

Der obige SQL-Befehl weist Delta Lake an, die Daten auf der Grundlage der Spalten name und age physisch neu anzuordnen. Durch die Zusammenführung ähnlicher Werte werden Abfragen, die auf diese Spalten filtern,weniger Daten scannen und schneller ausgeführt.

Fehlerbehebung und Fehlersuche in Delta Lake

Bei der Arbeit mit Delta Lake stößt man gelegentlich auf Straßensperren. DerSchlüssel zu liegt darin, diese Herausforderungen als Chance zu sehen, dein Verständnis zu vertiefen und die Technologie zu beherrschen. Hier sind einige meiner praktischen Erkenntnisse und Tipps, um dich wieder auf den Lernpfad zu bringen.

Häufige Fehler und Lösungen

Es können Probleme auftreten, wie z. B. Schemafehlanpassungen oder Probleme bei der Partitionsausrichtung . Wenn zum Beispiel die eingehenden Daten nicht mit dem Schema der Tabelle übereinstimmen ( ), können bei Schreibvorgängen Fehler auftreten. Ziehe in Betracht, Optionen wie mergeSchema zu nutzen, damit sich der Delta Lake anpassen kann.

Wenn deine Abfrageleistung sinkt, überprüfe außerdem, ob deine Daten optimal partitioniert sind oder ob ein Wartungsbefehl wie VACUUM helfen könnte, veraltete Dateien zu entfernen.

Fehlersuche bei Delta-Tabellen-Operationen

Wenn etwas nicht so funktioniert wie erwartet, mach dir keine Sorgen - das ist Teil des Prozesses! Ein guter erster Schritt ist die Überprüfung des Transaktionsprotokolls (zu finden im Verzeichnis _delta_log ). Dieses Protokoll bietet einen detaillierten Verlauf der Transaktionen und kann dir helfen, herauszufinden, wann und wo die Dinge aus dem Ruder gelaufen sind.

Wenn dir Ungereimtheiten oder unerwartete Änderungen auffallen, kannst du auch eine Zeitreise machen, um verschiedene Versionen der Tabellen zu vergleichen. Dieser Ansatz hilft dir, das Problem einzugrenzen und die Ereignisse zu verstehen, die zu dem Fehler geführt haben.

Fazit

Delta Lake bietet eine Vielzahl von Vorteilen - von robusten ACID-Transaktionen und effizientem Metadatenmanagement bis hin zu Funktionen wie Zeitreisen und Schemaevolution -, mit denen dubelastbare und skalierbare Datenpipelines aufbauen kannst. Die Integration mit Apache Spark bedeutet, dass Delta Lake die perfekte Ergänzung zur Optimierung deiner Arbeitsabläufe sein könnte, wenn du bereits in das Spark-Ökosystem investiert hast.

Diejenigen, die ihr Verständnis vertiefen wollen, sollten sich weitere Ressourcen auf DataCamp ansehen:

Kurs "Databricks-Konzepte " - Lerne die Grundprinzipien von Databricks und Delta Lake kennen und erfahre, wie sie die Datenverarbeitung und Analyse-Workflows verbessern.
Big Data Fundamentals with PySpark - Erfahre mehr über Apache Spark und PySpark und erlerne Techniken zur effizienten Verarbeitung großer Datensätze.
Kurs Einführung in die Datentechnik - Erfasse die grundlegenden Konzepte der Datentechnik und schaffe eine solide Grundlage für das Management von Big Data.
Der Kurs Moderne Datenarchitektur verstehen - Erforsche aktuelle Best Practices und Trends in der modernen Datenarchitektur, damit du in der dynamischen Datenlandschaft von heute die Nase vorn hast.

Viel Spaß beim Lernen und viel Erfolg auf deiner Datenreise!

Verbessere deine PySpark-Kenntnisse

Verbessere deine Datenkenntnisse durch die Beherrschung von Apache Spark.

Kostenloses Lernen beginnen

Was ist Delta Lake und wie unterscheidet er sich von herkömmlichen Data Lakes?

Wie kann ich Delta Lake in meiner Apache Spark-Umgebung einrichten?

Was sind die wichtigsten Merkmale, die Delta Lake zu einem wertvollen Instrument machen?

Welche Schritte sollte ich unternehmen, wenn ich bei der Arbeit mit Delta Lake auf Fehler stoße?

Welche Best Practices sollte ich bei der Verwendung von Delta Lake in meinen Datenpipelines beachten?

Author

Khalid Abdelaty

Data Engineer mit Fachkenntnissen in Python und Azure Cloud-Technologien, spezialisiert auf den Aufbau skalierbarer Datenpipelines und ETL-Prozesse. Zurzeit studiert er Informatik an der Universität Tanta und macht einen Bachelor of Science. Zertifizierter DataCamp Data Engineer mit nachgewiesener Erfahrung in Datenmanagement und Programmierung. Ehemaliger Microsoft Data Engineer Intern bei der Digital Egypt Pioneers Initiative und Microsoft Beta Student Ambassador, der technische Workshops leitet und Hackathons organisiert.

Themen

Datentechnik

Databricks

Lerne mehr über Data Engineering mit diesen Kursen!

Lernpfad

Dateningenieur in Python

0 Min.

Erwerbe gefragte Fähigkeiten, um Daten effizient zu erfassen, zu bereinigen, zu verwalten und Pipelines zu planen und zu überwachen, und hebe dich damit im Bereich Data Engineering ab.

Siehe Details

Kurs starten

Kurs

Introduction to Spark SQL in Python

4 Std.

19.2K

Learn how to manipulate data and create machine learning feature sets in Spark using SQL in Python.

Siehe Details

Kurs starten

Kurs

Data Management in Databricks

3 Std.

3.4K

Learn data management in Databricks with Delta Lake, including ACID transactions, schema enforcement, and security.

Siehe Details

Kurs starten

Verwandt

Der Blog

Lehrer/innen und Schüler/innen erhalten das Premium DataCamp kostenlos für ihre gesamte akademische Laufbahn

Keine Hacks, keine Tricks. Schüler/innen und Lehrer/innen, lest weiter, um zu erfahren, wie ihr die Datenerziehung, die euch zusteht, kostenlos bekommen könnt.

Nathaniel Taylor-Leach

4 Min.

Der Blog

Die 20 besten Snowflake-Interview-Fragen für alle Niveaus

Bist du gerade auf der Suche nach einem Job, der Snowflake nutzt? Bereite dich mit diesen 20 besten Snowflake-Interview-Fragen vor, damit du den Job bekommst!

Nisha Arya Ahmed

15 Min.

Der Blog

2022-2023 DataCamp Classrooms Jahresbericht

Zu Beginn des neuen Schuljahres ist DataCamp Classrooms motivierter denn je, das Lernen mit Daten zu demokratisieren. In den letzten 12 Monaten sind über 7.650 neue Klassenzimmer hinzugekommen.

Nathaniel Taylor-Leach

8 Min.

Der Blog

Q2 2023 DataCamp Donates Digest

DataCamp Donates hat im zweiten Quartal 2023 über 20.000 Stipendien an unsere gemeinnützigen Partner vergeben. Erfahre, wie fleißige benachteiligte Lernende diese Chancen in lebensverändernde berufliche Erfolge verwandelt haben.

Nathaniel Taylor-Leach

Der Blog

Top 30 Generative KI Interview Fragen und Antworten für 2024

Dieser Blog bietet eine umfassende Sammlung von Fragen und Antworten zu generativen KI-Interviews, die von grundlegenden Konzepten bis hin zu fortgeschrittenen Themen reichen.

Hesam Sheikh Hassani

15 Min.

Mehr anzeigen Mehr anzeigen

Was ist der Deltasee?

Merkmale des Deltasees

Architektur am Deltasee

Delta Lake File Format

Einrichtung des Deltasees

Schritt 1: Apache Spark und Delta Lake installieren

Schritt 2: Delta Lake mit Spark konfigurieren

Grundlagen des Deltasees

Schritt 1: Erstellen einer Delta-Tabelle

Schritt 2: Lesen aus einer Delta Tabelle

Schritt 3: Schreiben in eine Delta-Tabelle (Anhängen und Überschreiben)

Daten anhängen

Überschreiben von Daten

Delta Lake Erweiterte Funktionen

Zeitreise (Abfrage älterer Versionen von Daten)

Entwicklung und Durchsetzung von Schemata

Delta Lake Transaktionen (ACID)

Bewährte Praktiken für die Nutzung des Deltasees

Effiziente Datenpartitionierung

Verwaltung von Metadaten mit Delta Lake

Optimierung der Leistung mit Z-Ordering

Fehlerbehebung und Fehlersuche in Delta Lake

Häufige Fehler und Lösungen

Fehlersuche bei Delta-Tabellen-Operationen

Fazit

Verbessere deine PySpark-Kenntnisse

FAQs

Was sind die wichtigsten Merkmale, die Delta Lake zu einem wertvollen Instrument machen?

Welche Schritte sollte ich unternehmen, wenn ich bei der Arbeit mit Delta Lake auf Fehler stoße?

Welche Best Practices sollte ich bei der Verwendung von Delta Lake in meinen Datenpipelines beachten?

Lehrer/innen und Schüler/innen erhalten das Premium DataCamp kostenlos für ihre gesamte akademische Laufbahn

Die 20 besten Snowflake-Interview-Fragen für alle Niveaus

2022-2023 DataCamp Classrooms Jahresbericht

Q2 2023 DataCamp Donates Digest

Top 30 Generative KI Interview Fragen und Antworten für 2024

.css-1531qan{-webkit-text-decoration:none;text-decoration:none;color:inherit;}Dateningenieur in Python

Introduction to Spark SQL in Python

Data Management in Databricks

Lehrer/innen und Schüler/innen erhalten das Premium DataCamp kostenlos für ihre gesamte akademische Laufbahn

Die 20 besten Snowflake-Interview-Fragen für alle Niveaus

2022-2023 DataCamp Classrooms Jahresbericht

Q2 2023 DataCamp Donates Digest

Top 30 Generative KI Interview Fragen und Antworten für 2024

Dateningenieur in Python