Vai al contenuto principale
HomeSpark

Corso

Fondamenti di Big Data con PySpark

AvanzatoLivello di competenza
Aggiornato 02/2025
Impara le basi per lavorare con i big data usando PySpark.
Inizia Il Corso Gratis
SparkData Engineering4 h16 video55 Esercizi4,600 XP64,620Attestato di conseguimento

Crea il tuo account gratuito

o

Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.

Preferito dagli studenti di migliaia di aziende

Group

Vuoi formare 2 o più persone?

Prova DataCamp for Business

Descrizione del corso

Negli ultimi anni si è parlato molto di Big Data, e ormai sono entrati nel mainstream per molte aziende. Ma cosa sono davvero i Big Data? Questo corso copre i fondamenti dei Big Data tramite PySpark. Spark è un framework di "lightning fast cluster computing" per i Big Data. Fornisce un motore generale per l’elaborazione dei dati e ti permette di eseguire programmi fino a 100 volte più veloci in memoria, o 10 volte più veloci su disco, rispetto a Hadoop. Userai PySpark, un pacchetto Python per programmare in Spark, e le sue potenti librerie di livello superiore come SparkSQL, MLlib (per il Machine Learning), ecc. Esplorerai le opere di William Shakespeare, analizzerai i dati dei Mondiali Fifa 2018 ed eseguirai il clustering su insiemi di dati genomici. Al termine del corso, avrai una comprensione approfondita di PySpark e della sua applicazione all’analisi generale dei Big Data.

Prerequisiti

Introduction to Python
1

Introduction to Big Data analysis with Spark

This chapter introduces the exciting world of Big Data, as well as the various concepts and different frameworks for processing Big Data. You will understand why Apache Spark is considered the best framework for BigData.
Inizia Il Capitolo
2

Programming in PySpark RDD’s

3

PySpark SQL & DataFrames

4

Machine Learning with PySpark MLlib

Fondamenti di Big Data con PySpark
Corso
completato

Ottieni Attestato di conseguimento

Aggiungi questa certificazione al tuo profilo LinkedIn, al curriculum o al CV
Condividila sui social e nella valutazione delle tue performance
Iscriviti Ora

Unisciti a oltre 19 milioni di studenti e inizia Fondamenti di Big Data con PySpark oggi!

Crea il tuo account gratuito

o

Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.

Aumenta le tue competenze sui dati con l'app di DataCamp

Avanza ovunque ti trovi con i nostri corsi per dispositivi mobili e le nostre sfide di programmazione quotidiane da 5 minuti.