Ga naar hoofdinhoud
HomeSpark

Cursus

Basis van PySpark

GemiddeldVaardigheidsniveau
Bijgewerkt 03-2025
Start Cursus Kosteloos
SparkData Engineering4 u45 Opdrachten3,850 XP150K+Prestatieverklaring

Maak je gratis account aan

of

Door verder te gaan accepteer je onze Gebruiksvoorwaarden, ons Privacybeleid en dat je gegevens worden opgeslagen in de VS.

Geliefd bij leerlingen van duizenden bedrijven

Group

Wil je 2 of meer mensen trainen?

Probeer DataCamp for Business

Cursusbeschrijving

In deze cursus leer je hoe je Spark gebruikt vanuit Python! Spark is een tool voor parallelle berekeningen met grote gegevenssets en werkt goed samen met Python. PySpark is het Python-pakket dat dit mogelijk maakt. Je gebruikt dit pakket om te werken met gegevens over vluchten vanuit Portland en Seattle. Je leert deze gegevens te wranglen en een complete Machine Learning-pijplijn te bouwen om te voorspellen of vluchten vertraging zullen hebben. Maak je klaar om wat Spark in je Python-code te stoppen en te duiken in de wereld van high-performance Machine Learning!

Vereisten

Introduction to Python
1

Getting to know PySpark

In this chapter, you'll learn how Spark manages data and how can you read and write tables from Python.
Hoofdstuk Beginnen
2

Manipulating data

3

Getting started with machine learning pipelines

4

Model tuning and selection

Basis van PySpark
Cursus
voltooid

Verdien een prestatieverklaring

Voeg deze referentie toe aan je LinkedIn-profiel, cv of curriculum vitae
Deel het op sociale media en in je functioneringsgesprek
Schrijf Je Nu in

Sluit je aan bij meer dan 19 miljoen leerlingen en start vandaag nog met Basis van PySpark!

Maak je gratis account aan

of

Door verder te gaan accepteer je onze Gebruiksvoorwaarden, ons Privacybeleid en dat je gegevens worden opgeslagen in de VS.

Ontwikkel je datavaardigheden met DataCamp voor Mobiel

Maak vooruitgang onderweg met onze mobiele cursussen en dagelijkse 5-minuten programmeeruitdagingen.