Corso
Machine Learning con PySpark
AvanzatoLivello di competenza
Aggiornato 11/2025
SparkMachine Learning4 h16 video56 Esercizi4,550 XP29,686Attestato di conseguimento
Crea il tuo account gratuito
Continua con GoogleMostra più opzionio
Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.
Preferito dagli studenti di migliaia di aziende
Formare un team?
Prova per il BusinessDescrizione del corso
Impara a usare Apache Spark per il machine learning
Spark è uno strumento potente e versatile per lavorare con i Big Data. Spark gestisce in modo trasparente la distribuzione dei compiti di calcolo all'interno di un cluster. Questo vuol dire che le operazioni sono veloci, ma ti permette anche di concentrarti sull'analisi invece di preoccuparti dei dettagli tecnici. In questo corso imparerai come inserire i dati in Spark e poi approfondirai i tre algoritmi fondamentali di Spark Machine Learning: Regressione lineare, regressione logistica/classificatori e creazione di pipeline.Costruire e testare alberi decisionali
Creare i tuoi alberi decisionali è un ottimo modo per iniziare a esplorare i modelli di apprendimento automatico. Userai un algoritmo chiamato "partizionamento ricorsivo" per dividere i dati in due classi e trovare un predittore all'interno dei tuoi dati che porti alla divisione più informativa delle due classi, e ripeterai questa operazione con altri nodi. Puoi quindi usare il tuo albero decisionale per fare previsioni con nuovi dati.Padroneggia la logistica e la regressione lineare in PySpark
La regressione logistica e lineare sono tecniche di machine learning super importanti supportate da PySpark. Imparerai a costruire e valutare modelli di regressione logistica, prima di passare alla creazione di modelli di regressione lineare che ti aiuteranno a perfezionare i tuoi predittori selezionando solo le opzioni più rilevanti.Alla fine del corso, ti sentirai sicuro nell'applicare le tue nuove conoscenze sul machine learning, grazie alle attività pratiche e ai set di dati di esercitazione che troverai durante il corso.
Prerequisiti
Supervised Learning with scikit-learnIntroduction to PySpark1
Introduzione
Spark è un framework per lavorare con i Big Data. In questo capitolo vedrai alcune nozioni di base su Spark e sul Machine Learning. Poi scoprirai come connetterti a Spark con Python e caricare dati CSV.
2
Classificazione
Ora che sai come importare i dati in Spark, passerai alla costruzione di due tipi di modelli di classificazione: Alberi decisionali e Regressione logistica. Scoprirai anche alcuni approcci alla preparazione dei dati.
3
Regressione
Successivamente imparerai a creare modelli di Regressione lineare. Inoltre vedrai come arricchire i dati progettando nuovi predittori e un approccio solido per selezionare solo i predittori più rilevanti.
4
Ensemble e Pipeline
Infine imparerai a rendere i tuoi modelli più efficienti. Scoprirai come usare le pipeline per rendere il codice più chiaro e facile da mantenere. Poi userai la convalida incrociata per testare meglio i modelli e scegliere buoni iperparametri. Infine sperimenterai due tipi di modelli ensemble.
Machine Learning con PySpark
Corso completato
Ottieni Attestato di conseguimento
Aggiungi questa certificazione al tuo profilo LinkedIn, al curriculum o al CVCondividila sui social e nella valutazione delle tue performanceIscriviti ora
Unisciti a oltre 19 milioni di studenti e inizia Machine Learning con PySpark oggi!
Crea il tuo account gratuito
Continua con GoogleMostra più opzionio
Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.
Aumenta le tue competenze sui dati con l'app di DataCamp
Avanza ovunque ti trovi con i nostri corsi per dispositivi mobili e le nostre sfide di programmazione quotidiane da 5 minuti.