Cursus
Parallel programmeren met Dask in Python
GemiddeldVaardigheidsniveau
Bijgewerkt 04-2024Start Cursus Kosteloos
Inbegrepen bijPremium or Teams
PythonProgramming4 u15 videos51 Opdrachten4,150 XP4,780Prestatieverklaring
Maak je gratis account aan
of
Door verder te gaan accepteer je onze Gebruiksvoorwaarden, ons Privacybeleid en dat je gegevens worden opgeslagen in de VS.Geliefd bij leerlingen van duizenden bedrijven
Wil je 2 of meer mensen trainen?
Probeer DataCamp for BusinessCursusbeschrijving
Gebruik parallelle verwerking om je Python-code sneller te maken
In deze cursus van 4 uur leer je hoe je met parallelle verwerking met Dask in Python je werk sneller kunt doen.Als je met big data werkt, kom je vaak twee dingen tegen: je gebruikt te veel geheugen en het duurt lang voordat dingen klaar zijn. De Dask-bibliotheek kan je geheugengebruik verminderen door stukjes data alleen te laden als dat echt nodig is. Het kan de looptijd verkorten door al je beschikbare computerkernen tegelijk te gebruiken. Het beste van alles is dat je maar weinig aan je bestaande Python-code hoeft te veranderen.
Grote gestructureerde gegevens analyseren met Dask DataFrames
In deze cursus gebruik je Dask om Spotify-songgegevens te analyseren, afbeeldingen van gebarentaal te verwerken, trends in weergegevens te berekenen, audio-opnames te analyseren en machine learning-modellen te trainen op basis van big data.Je begint met de basis van Dask en ontdekt hoe je met parallelle verwerking in Python bijna elke code sneller kunt maken. Vervolgens ga je kijken naar Dask DataFrames en arrays en hoe je die kunt gebruiken om grote gestructureerde gegevens te analyseren.
Train machine learning-modellen met Dask-ML
Terwijl je de 51 oefeningen in deze cursus doorloopt, leer je hoe je allerlei soorten data kunt verwerken met behulp van Dask bags om met ongestructureerde en gestructureerde data te werken. Tot slot leer je hoe je Dask in Python kunt gebruiken om machine learning-modellen te trainen en je computersnelheid te verbeteren.Vereisten
Data Manipulation with pandasPython Toolbox1
Lazy Evaluation and Parallel Computing
This chapter will teach you the basics of Dask and lazy evaluation. At the end of this chapter, you'll be able to speed up almost any Python code by using parallel processing or multi-threading. You'll learn the difference between these two task scheduling methods and which one is better under which circumstances.
2
Parallel Processing of Big, Structured Data
Here you’ll learn how to analyze big structured data using Dask arrays and Dask DataFrames. You'll learn how everything you know about NumPy and pandas can easily be applied to data that is too large to fit in memory.
3
Dask Bags for Unstructured Data
Process any kind of data. You'll learn how Dask bags can be used to efficiently process unstructured text data, semi-structured JSON data, and even recorded audio.
4
Dask Machine Learning and Final Pieces
Harness the power of Dask to train machine learning models. You'll learn how to train machine learning models on big data using the Dask-ML package, and how to split Dask calculations across a mixture of processes and threads for even greater computing speed.
Parallel programmeren met Dask in Python
Cursus voltooid
Verdien een prestatieverklaring
Voeg deze referentie toe aan je LinkedIn-profiel, cv of curriculum vitaeDeel het op sociale media en in je functioneringsgesprek
Inbegrepen bijPremium or Teams
Schrijf Je Nu inSluit je aan bij meer dan 19 miljoen leerlingen en start vandaag nog met Parallel programmeren met Dask in Python!
Maak je gratis account aan
of
Door verder te gaan accepteer je onze Gebruiksvoorwaarden, ons Privacybeleid en dat je gegevens worden opgeslagen in de VS.