Corso
Introduzione a PySpark
IntermedioLivello di competenza
Aggiornato 01/2026
SparkData Engineering4 h11 video36 Esercizi2,850 XP29,450Attestato di conseguimento
Crea il tuo account gratuito
Continua con GoogleMostra più opzionio
Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.
Preferito dagli studenti di migliaia di aziende
Formare un team?
Prova per il BusinessDescrizione del corso
Perché Spark? Perché adesso?
Scopri la velocità e la scalabilità di Apache Spark, il potente framework fatto apposta per gestire i big data. Grazie a lezioni interattive ed esercizi pratici, scoprirai come l'elaborazione in memoria di Spark gli dia un vantaggio rispetto ai framework tradizionali come Hadoop. Inizierai configurando le sessioni Spark e ti immergerai nei componenti principali come i Resilient Distributed Datasets (RDD) e i DataFrame. Impara a filtrare, raggruppare e unire i set di dati in modo facile mentre lavori su esempi reali.Migliora le tue competenze in Python e SQL per i Big Data
Scopri come usare PySpark SQL per fare query e gestire i dati usando la sintassi SQL che già conosci. Affronta schemi, tipi di dati complessi e funzioni definite dall'utente (UDF), mentre impari a gestire la cache e a ottimizzare le prestazioni per i sistemi distribuiti.Costruisci le tue basi per i big data
Alla fine di questo corso, avrai la sicurezza necessaria per gestire, interrogare ed elaborare grandi quantità di dati usando PySpark. Con queste competenze di base, sarai pronto per approfondire argomenti più complessi come l'apprendimento automatico e l'analisi dei big data.Prerequisiti
Introduction to SQLData Manipulation with pandas1
Introduzione ad Apache Spark e PySpark
Un’introduzione generale a PySpark e al calcolo distribuito. Questa sezione presenta PySpark, i DataFrame di PySpark e gli RDD.
2
PySpark in Python
Prosecuzione su DataFrame e tipi di dati complessi. Questa sezione approfondisce ciò che offrono i DataFrame in PySpark e introduce alcuni concetti di Spark SQL.
3
Introduzione a PySpark SQL
Approfondisci come sfruttare Spark SQL e PySpark per l’elaborazione di dati su larga scala, unendo la semplicità di SQL alla potenza del calcolo distribuito di PySpark per gestire grandi insiemi di dati in modo efficiente.
Introduzione a PySpark
Corso completato
Ottieni Attestato di conseguimento
Aggiungi questa certificazione al tuo profilo LinkedIn, al curriculum o al CVCondividila sui social e nella valutazione delle tue performanceIscriviti ora
Unisciti a oltre 19 milioni di studenti e inizia Introduzione a PySpark oggi!
Crea il tuo account gratuito
Continua con GoogleMostra più opzionio
Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.
Aumenta le tue competenze sui dati con l'app di DataCamp
Avanza ovunque ti trovi con i nostri corsi per dispositivi mobili e le nostre sfide di programmazione quotidiane da 5 minuti.