Corso
Fondamenti di Big Data con PySpark
AvanzatoLivello di competenza
Aggiornato 02/2025
SparkData Engineering4 h16 video55 Esercizi4,600 XP65,280Attestato di conseguimento
Crea il tuo account gratuito
Continua con GoogleMostra più opzionio
Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.
Preferito dagli studenti di migliaia di aziende
Formare un team?
Prova per il BusinessDescrizione del corso
Prerequisiti
Introduction to Python1
Introduzione all’analisi dei Big Data con Spark
Questo capitolo introduce l’entusiasmante mondo dei Big Data, insieme ai vari concetti e ai diversi framework per l’elaborazione dei Big Data. Capirai perché Apache Spark è considerato il miglior framework per i Big Data.
2
Programmare con gli RDD di PySpark
La principale astrazione offerta da Spark è il resilient distributed dataset (RDD), che è il tipo di dato fondamentale e portante di questo motore. Questo capitolo introduce gli RDD e mostra come crearli ed eseguirli usando le RDD Transformations e le Actions.
3
PySpark SQL e DataFrame
In questo capitolo scoprirai Spark SQL, un modulo di Spark per l’elaborazione di dati strutturati. Fornisce un’astrazione di programmazione chiamata DataFrame e può anche funzionare come motore distribuito per query SQL. Questo capitolo mostra come Spark SQL ti permette di usare i DataFrame in Python.
4
Machine Learning con PySpark MLlib
PySpark MLlib è la libreria scalabile di Machine Learning di Apache Spark per Python, composta da algoritmi e utilità comuni. In questo ultimo capitolo imparerai importanti algoritmi di Machine Learning. Costruirai un motore di raccomandazione di film e un filtro antispam e userai il clustering k-means.
Fondamenti di Big Data con PySpark
Corso completato
Ottieni Attestato di conseguimento
Aggiungi questa certificazione al tuo profilo LinkedIn, al curriculum o al CVCondividila sui social e nella valutazione delle tue performanceIscriviti ora
Unisciti a oltre 19 milioni di studenti e inizia Fondamenti di Big Data con PySpark oggi!
Crea il tuo account gratuito
Continua con GoogleMostra più opzionio
Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.
Aumenta le tue competenze sui dati con l'app di DataCamp
Avanza ovunque ti trovi con i nostri corsi per dispositivi mobili e le nostre sfide di programmazione quotidiane da 5 minuti.