course
Feature Engineering with PySpark
AvanceradFärdighetsnivå
Uppdaterad 2026-01SparkData Manipulation4 timmar16 videos60 exercises5,000 XP17,615Uttalande om prestation
Skapa ditt gratiskonto
eller
Genom att fortsätta accepterar du våra Användarvillkor, vår Integritetspolicy och att dina uppgifter lagras i USA.Älskad av elever på tusentals företag
Utbilda 2 eller fler personer?
Testa DataCamp for BusinessKursbeskrivning
Förkunskapskrav
Supervised Learning with scikit-learnIntroduction to PySpark1
Exploratory Data Analysis
Get to know a bit about your problem before you dive in! Then learn how to statistically and visually inspect your dataset!
2
Wrangling with Spark Functions
Real data is rarely clean and ready for analysis. In this chapter learn to remove unneeded information, handle missing values and add additional data to your analysis.
3
Feature Engineering
In this chapter learn how to create new features for your machine learning model to learn from. We'll look at generating them by combining fields, extracting values from messy columns or encoding them for better results.
4
Building a Model
In this chapter we'll learn how to choose which type of model we want. Then we will learn how to apply our data to the model and evaluate it. Lastly, we'll learn how to interpret the results and save the model for later!
Feature Engineering with PySpark
Kursen är
Få ett prestationsutlåtande
Lägg till denna inloggningsuppgifter i din LinkedIn-profil, ditt CV eller ditt CVDela det på sociala medier och i ditt prestationssamtalRegistrera Dig Nu
Gå med över 19 miljoner elever och börja Feature Engineering with PySpark idag!
Skapa ditt gratiskonto
eller
Genom att fortsätta accepterar du våra Användarvillkor, vår Integritetspolicy och att dina uppgifter lagras i USA.Utveckla dina datakunskaper med DataCamp för mobilen
Gör framsteg när du är på språng med våra mobila kurser och dagliga 5-minuters kodningsutmaningar.