Accéder au contenu principal


Feature Engineering with PySpark

Actualisé 01/2025
Learn the gritty details that data scientists are spending 70-80% of their time on; data wrangling and feature engineering.
Commencer le cours gratuitement

Inclus gratuitementPremium or Teams

SparkData Manipulation4 heures16 vidéos60 exercices5,000 XP15,138Déclaration de réalisation

Créez votre compte gratuit



En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.

Formation de 2 personnes ou plus ?

Essayer DataCamp for Business

Apprécié par les apprenants de milliers d’entreprises

Description du cours

The real world is messy and your job is to make sense of it. Toy datasets like MTCars and Iris are the result of careful curation and cleaning, even so the data needs to be transformed for it to be useful for powerful machine learning algorithms to extract meaning, forecast, classify or cluster. This course will cover the gritty details that data scientists are spending 70-80% of their time on; data wrangling and feature engineering. With size of datasets now becoming ever larger, let's use PySpark to cut this Big Data problem down to size!

Conditions préalables

Introduction to PySparkSupervised Learning with scikit-learn

Exploratory Data Analysis

Commencer le chapitre

Wrangling with Spark Functions

Commencer le chapitre

Feature Engineering

Commencer le chapitre

Building a Model

Commencer le chapitre
Feature Engineering with PySpark

Earn Déclaration de réalisation

Ajoutez ces informations d’identification à votre profil LinkedIn, à votre CV ou à votre CV
Partagez-le sur les réseaux sociaux et dans votre évaluation de performance

Inclus avecPremium or Teams

S'inscrire maintenant

Inscrivez-vous 15 millions d’apprenants et commencer Feature Engineering with PySpark Aujourd’hui!

Créez votre compte gratuit



En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.