Ga naar hoofdinhoud
HomeSpark

Cursus

Big Data Fundamentals met PySpark

GevorderdVaardigheidsniveau
Bijgewerkt 02-2025
Leer de basisprincipes van werken met big data met PySpark.
Start Cursus Kosteloos
SparkData Engineering
4 u
16 videos
55 Opdrachten
4,600 XP
65,280
Bewijs van Prestatie

Maak je kosteloos account aan

Ga verder met GoogleMeer opties weergeven

of


Door verder te gaan accepteer je onze Gebruiksvoorwaarden, ons Privacybeleid en dat je gegevens worden opgeslagen in de VS.

Geliefd bij leerlingen van duizenden bedrijven

Group

Een team trainen?

Probeer voor bedrijven

Cursusbeschrijving

Er is de afgelopen jaren veel te doen geweest rond Big Data, en inmiddels is het voor veel bedrijven mainstream. Maar wat is Big Data nu precies? Deze cursus behandelt de basisprincipes van Big Data met PySpark. Spark is een framework voor Big Data dat "bliksemsnel clusteren berekeningen" mogelijk maakt. Het biedt een algemene engine voor gegevensverwerking en laat je programma’s tot 100x sneller in het geheugen draaien, of 10x sneller op schijf, dan Hadoop. Je werkt met PySpark, een Python-pakket voor Spark-programmering, en met krachtige, hoog-niveau bibliotheken zoals SparkSQL, MLlib (voor Machine Learning), enzovoort. Je gaat aan de slag met werken van William Shakespeare, analyseert Fifa 2018-gegevens en voert clustering uit op genomische gegevenssets. Aan het einde van deze cursus heb je een diepgaand begrip van PySpark en hoe je het toepast op algemene Big Data-analyse.

Vereisten

Introduction to Python
1

Introductie tot Big Data-analyse met Spark

In dit hoofdstuk maak je kennis met de spannende wereld van Big Data, evenals met de verschillende concepten en frameworks voor de verwerking ervan. Je ontdekt waarom Apache Spark wordt gezien als het beste framework voor Big Data.
Hoofdstuk beginnen
2

Programmeren met PySpark-RDD’s

De belangrijkste abstractie die Spark biedt is een resilient distributed dataset (RDD), het fundamentele en ruggengraat-datatype van deze engine. Dit hoofdstuk introduceert RDD’s en laat zien hoe je RDD’s kunt maken en uitvoeren met RDD-transformations en actions.
Hoofdstuk beginnen
4

Machine Learning met PySpark MLlib

Big Data Fundamentals met PySpark
Cursus
voltooid

Verdien een prestatieverklaring

Voeg deze referentie toe aan je LinkedIn-profiel, cv of curriculum vitae
Deel het op sociale media en in je functioneringsgesprek
Schrijf je nu in

Sluit je aan bij meer dan 19 miljoen leerlingen en start vandaag nog met Big Data Fundamentals met PySpark!

Maak je kosteloos account aan

Ga verder met GoogleMeer opties weergeven

of


Door verder te gaan accepteer je onze Gebruiksvoorwaarden, ons Privacybeleid en dat je gegevens worden opgeslagen in de VS.

Ontwikkel je datavaardigheden met DataCamp voor Mobiel

Maak vooruitgang onderweg met onze mobiele cursussen en dagelijkse 5-minuten programmeeruitdagingen.