Kurs
Maschinelles Lernen mit PySpark
ExperteSchwierigkeitsgrad
Aktualisiert 11.2025Kurs kostenlos starten
Im Lieferumfang enthalten beiPremium or Teams
SparkMachine Learning4 Std.16 Videos56 Übungen4,550 XP28,979Leistungsnachweis
Kostenloses Konto erstellen
oder
Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.Beliebt bei Lernenden in Tausenden Unternehmen
Training für 2 oder mehr Personen?
Probiere es mit DataCamp for BusinessKursbeschreibung
Lerne Apache Spark für maschinelles Lernen zu nutzen
Spark ist ein leistungsstarkes, universell einsetzbares Werkzeug für die Arbeit mit Big Data. Spark kümmert sich transparent um die Verteilung von Rechenaufgaben in einem Cluster. Das bedeutet, dass die Abläufe schnell sind, aber es erlaubt dir auch, dich auf die Analyse zu konzentrieren, anstatt dich um technische Details zu kümmern. In diesem Kurs lernst du, wie du Daten in Spark einspeisen kannst, und beschäftigst dich dann mit den drei grundlegenden Algorithmen für maschinelles Lernen in Spark: Lineare Regression, logistische Regression/Klassifikatoren und das Erstellen von Pipelines.Entscheidungsbäume erstellen und testen
Das Erstellen eigener Entscheidungsbäume ist eine gute Möglichkeit, um Modelle des maschinellen Lernens kennenzulernen. Du verwendest einen Algorithmus namens "Rekursive Partitionierung", um die Daten in zwei Klassen aufzuteilen und einen Prädiktor innerhalb deiner Daten zu finden, der die informativste Aufteilung der beiden Klassen ergibt, und wiederholst diesen Vorgang mit weiteren Knoten. Du kannst deinen Entscheidungsbaum dann verwenden, um mit neuen Daten Vorhersagen zu treffen.Beherrsche logistische und lineare Regression in PySpark
Logistische und lineare Regression sind wichtige maschinelle Lerntechniken, die von PySpark unterstützt werden. Du lernst, wie du logistische Regressionsmodelle erstellst und auswertest, bevor du zu linearen Regressionsmodellen übergehst, mit denen du deine Prädiktoren auf die relevantesten Optionen beschränken kannst.Am Ende des Kurses wirst du dein neu erworbenes Wissen über maschinelles Lernen dank der praktischen Aufgaben und Übungsdatensätze, die du während des Kurses findest, sicher anwenden können.
Voraussetzungen
Supervised Learning with scikit-learnIntroduction to PySpark1
Introduction
Spark is a framework for working with Big Data. In this chapter you'll cover some background about Spark and Machine Learning. You'll then find out how to connect to Spark using Python and load CSV data.
2
Classification
Now that you are familiar with getting data into Spark, you'll move onto building two types of classification model: Decision Trees and Logistic Regression. You'll also find out about a few approaches to data preparation.
3
Regression
Next you'll learn to create Linear Regression models. You'll also find out how to augment your data by engineering new predictors as well as a robust approach to selecting only the most relevant predictors.
4
Ensembles & Pipelines
Finally you'll learn how to make your models more efficient. You'll find out how to use pipelines to make your code clearer and easier to maintain. Then you'll use cross-validation to better test your models and select good model parameters. Finally you'll dabble in two types of ensemble model.
Maschinelles Lernen mit PySpark
Kurs abgeschlossen
Leistungsnachweis verdienen
Füge diesen Fähigkeitsnachweis zu Deinem LinkedIn-Profil, Anschreiben oder Lebenslauf hinzuTeile es auf Social Media und in Deiner Leistungsbeurteilung
Im Lieferumfang enthalten beiPremium or Teams
Jetzt anmeldenSchließe dich 19 Millionen Lernenden an und starte Maschinelles Lernen mit PySpark heute!
Kostenloses Konto erstellen
oder
Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.