Direkt zum Inhalt
StartseiteSpark

Kurs

Maschinelles Lernen mit PySpark

ExperteSchwierigkeitsgrad
Aktualisierte 06.2025
Kurs kostenlos starten

Im Lieferumfang enthaltenPremium or Teams

SparkMachine Learning4 Stunden16 Videos56 Übungen4,550 XP26,226Leistungsnachweis

Kostenloses Konto erstellen

oder

Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.
Group

Trainierst du 2 oder mehr?

Versuchen DataCamp for Business

Beliebt bei Lernenden in Tausenden Unternehmen

Kursbeschreibung

Lerne Apache Spark für maschinelles Lernen zu nutzen

Spark ist ein leistungsstarkes, universell einsetzbares Werkzeug für die Arbeit mit Big Data. Spark kümmert sich transparent um die Verteilung von Rechenaufgaben in einem Cluster. Das bedeutet, dass die Abläufe schnell sind, aber es erlaubt dir auch, dich auf die Analyse zu konzentrieren, anstatt dich um technische Details zu kümmern. In diesem Kurs lernst du, wie du Daten in Spark einspeisen kannst, und beschäftigst dich dann mit den drei grundlegenden Algorithmen für maschinelles Lernen in Spark: Lineare Regression, logistische Regression/Klassifikatoren und das Erstellen von Pipelines.

Entscheidungsbäume erstellen und testen

Das Erstellen eigener Entscheidungsbäume ist eine gute Möglichkeit, um Modelle des maschinellen Lernens kennenzulernen. Du verwendest einen Algorithmus namens "Rekursive Partitionierung", um die Daten in zwei Klassen aufzuteilen und einen Prädiktor innerhalb deiner Daten zu finden, der die informativste Aufteilung der beiden Klassen ergibt, und wiederholst diesen Vorgang mit weiteren Knoten. Du kannst deinen Entscheidungsbaum dann verwenden, um mit neuen Daten Vorhersagen zu treffen.

Beherrsche logistische und lineare Regression in PySpark

Logistische und lineare Regression sind wichtige maschinelle Lerntechniken, die von PySpark unterstützt werden. Du lernst, wie du logistische Regressionsmodelle erstellst und auswertest, bevor du zu linearen Regressionsmodellen übergehst, mit denen du deine Prädiktoren auf die relevantesten Optionen beschränken kannst.

Am Ende des Kurses wirst du dein neu erworbenes Wissen über maschinelles Lernen dank der praktischen Aufgaben und Übungsdatensätze, die du während des Kurses findest, sicher anwenden können.

Voraussetzungen

Supervised Learning with scikit-learnIntroduction to PySpark
1

Einführung

Kapitel starten
2

Klassifikation

Kapitel starten
3

Regression

Kapitel starten
4

Ensembles & Pipelines

Kapitel starten
Maschinelles Lernen mit PySpark
Kurs
abgeschlossen

Leistungsnachweis verdienen

Fügen Sie diese Anmeldeinformationen zu Ihrem LinkedIn-Profil, Lebenslauf oder Lebenslauf hinzu
Teilen Sie es in den sozialen Medien und in Ihrer Leistungsbeurteilung

Im Lieferumfang enthaltenPremium or Teams

Jetzt anmelden

Mach mit 17 Millionen Lernende und starte Maschinelles Lernen mit PySpark heute!

Kostenloses Konto erstellen

oder

Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.