Corso
Programmazione parallela con Dask in Python
IntermedioLivello di competenza
Aggiornato 04/2024
PythonProgramming4 h15 video51 Esercizi4,150 XP4,895Attestato di conseguimento
Crea il tuo account gratuito
Continua con GoogleMostra più opzionio
Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.
Preferito dagli studenti di migliaia di aziende
Formare un team?
Prova per il BusinessDescrizione del corso
Usa l'elaborazione parallela per rendere più veloce il tuo codice Python
Con questo corso di 4 ore scoprirai come l'elaborazione parallela con Dask in Python può rendere più veloci i tuoi flussi di lavoro.Quando si lavora con i big data, ci si trova spesso di fronte a due problemi: usare troppa memoria e tempi di esecuzione lunghi. La libreria Dask può ridurre l'uso della memoria caricando blocchi di dati solo quando serve. Può ridurre i tempi di esecuzione usando tutti i core di elaborazione disponibili in parallelo. La cosa migliore è che non devi cambiare quasi niente del tuo codice Python attuale.
Analizza grandi quantità di dati strutturati usando Dask DataFrames
In questo corso userai Dask per analizzare i dati delle canzoni di Spotify, elaborare immagini dei gesti della lingua dei segni, calcolare le tendenze dei dati meteorologici, analizzare registrazioni audio e addestrare modelli di machine learning sui big data.Inizierai imparando le basi di Dask, scoprendo come l'elaborazione parallela in Python può rendere più veloce quasi tutti i codici. Poi, scoprirai i DataFrame e gli array di Dask e come usarli per analizzare grandi quantità di dati strutturati.
Addestra modelli di machine learning usando Dask-ML
Man mano che avanzi nei 51 esercizi di questo corso, imparerai a gestire qualsiasi tipo di dati, usando i bag Dask per lavorare con dati sia strutturati che non strutturati. Infine, imparerai come usare Dask in Python per addestrare modelli di machine learning e migliorare la velocità di elaborazione.Prerequisiti
Data Manipulation with pandasPython Toolbox1
Valutazione pigra e calcolo parallelo
Questo capitolo ti insegnerà le basi di Dask e della valutazione pigra. Alla fine del capitolo, saprai velocizzare quasi qualsiasi codice Python usando l’elaborazione parallela o il multi-threading. Imparerai la differenza tra questi due metodi di pianificazione dei task e quale sia più adatto in base alle circostanze.
2
Elaborazione parallela di grandi dati strutturati
Qui imparerai ad analizzare grandi dati strutturati usando Dask array e Dask DataFrame. Scoprirai come tutto ciò che conosci di NumPy e pandas può essere applicato facilmente a dati troppo grandi per entrare in memoria.
3
Dask Bag per dati non strutturati
Elabora qualsiasi tipo di dato. Imparerai come i Dask bag possano essere usati per elaborare in modo efficiente dati testuali non strutturati, dati JSON semi-strutturati e persino audio registrato.
4
Dask per Machine Learning e ultime componenti
Sfrutta la potenza di Dask per addestrare modelli di Machine Learning. Imparerai come addestrare modelli di Machine Learning su big data usando il pacchetto Dask-ML e come distribuire i calcoli Dask tra processi e thread per ottenere una velocità di calcolo ancora maggiore.
Programmazione parallela con Dask in Python
Corso completato
Ottieni Attestato di conseguimento
Aggiungi questa certificazione al tuo profilo LinkedIn, al curriculum o al CVCondividila sui social e nella valutazione delle tue performanceIscriviti ora
Unisciti a oltre 19 milioni di studenti e inizia Programmazione parallela con Dask in Python oggi!
Crea il tuo account gratuito
Continua con GoogleMostra più opzionio
Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.
Aumenta le tue competenze sui dati con l'app di DataCamp
Avanza ovunque ti trovi con i nostri corsi per dispositivi mobili e le nostre sfide di programmazione quotidiane da 5 minuti.