Corso
Programmazione parallela con Dask in Python
IntermedioLivello di competenza
Aggiornato 04/2024Inizia Il Corso Gratis
Incluso conPremium or Team
PythonProgramming4 h15 video51 Esercizi4,150 XP4,780Attestato di conseguimento
Crea il tuo account gratuito
o
Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.Preferito dagli studenti di migliaia di aziende
Vuoi formare 2 o più persone?
Prova DataCamp for BusinessDescrizione del corso
Usa l'elaborazione parallela per rendere più veloce il tuo codice Python
Con questo corso di 4 ore scoprirai come l'elaborazione parallela con Dask in Python può rendere più veloci i tuoi flussi di lavoro.Quando si lavora con i big data, ci si trova spesso di fronte a due problemi: usare troppa memoria e tempi di esecuzione lunghi. La libreria Dask può ridurre l'uso della memoria caricando blocchi di dati solo quando serve. Può ridurre i tempi di esecuzione usando tutti i core di elaborazione disponibili in parallelo. La cosa migliore è che non devi cambiare quasi niente del tuo codice Python attuale.
Analizza grandi quantità di dati strutturati usando Dask DataFrames
In questo corso userai Dask per analizzare i dati delle canzoni di Spotify, elaborare immagini dei gesti della lingua dei segni, calcolare le tendenze dei dati meteorologici, analizzare registrazioni audio e addestrare modelli di machine learning sui big data.Inizierai imparando le basi di Dask, scoprendo come l'elaborazione parallela in Python può rendere più veloce quasi tutti i codici. Poi, scoprirai i DataFrame e gli array di Dask e come usarli per analizzare grandi quantità di dati strutturati.
Addestra modelli di machine learning usando Dask-ML
Man mano che avanzi nei 51 esercizi di questo corso, imparerai a gestire qualsiasi tipo di dati, usando i bag Dask per lavorare con dati sia strutturati che non strutturati. Infine, imparerai come usare Dask in Python per addestrare modelli di machine learning e migliorare la velocità di elaborazione.Prerequisiti
Data Manipulation with pandasPython Toolbox1
Lazy Evaluation and Parallel Computing
This chapter will teach you the basics of Dask and lazy evaluation. At the end of this chapter, you'll be able to speed up almost any Python code by using parallel processing or multi-threading. You'll learn the difference between these two task scheduling methods and which one is better under which circumstances.
2
Parallel Processing of Big, Structured Data
Here you’ll learn how to analyze big structured data using Dask arrays and Dask DataFrames. You'll learn how everything you know about NumPy and pandas can easily be applied to data that is too large to fit in memory.
3
Dask Bags for Unstructured Data
Process any kind of data. You'll learn how Dask bags can be used to efficiently process unstructured text data, semi-structured JSON data, and even recorded audio.
4
Dask Machine Learning and Final Pieces
Harness the power of Dask to train machine learning models. You'll learn how to train machine learning models on big data using the Dask-ML package, and how to split Dask calculations across a mixture of processes and threads for even greater computing speed.
Programmazione parallela con Dask in Python
Corso completato
Ottieni Attestato di conseguimento
Aggiungi questa certificazione al tuo profilo LinkedIn, al curriculum o al CVCondividila sui social e nella valutazione delle tue performance
Incluso conPremium or Team
Iscriviti OraUnisciti a oltre 19 milioni di studenti e inizia Programmazione parallela con Dask in Python oggi!
Crea il tuo account gratuito
o
Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.