Cursus
Parallel programmeren met Dask in Python
GemiddeldVaardigheidsniveau
Bijgewerkt 04-2024
PythonProgramming4 u15 videos51 Opdrachten4,150 XP4,895Bewijs van Prestatie
Maak je kosteloos account aan
Ga verder met GoogleMeer opties weergevenof
Door verder te gaan accepteer je onze Gebruiksvoorwaarden, ons Privacybeleid en dat je gegevens worden opgeslagen in de VS.
Geliefd bij leerlingen van duizenden bedrijven
Een team trainen?
Probeer voor bedrijvenCursusbeschrijving
Gebruik parallelle verwerking om je Python-code sneller te maken
In deze cursus van 4 uur leer je hoe je met parallelle verwerking met Dask in Python je werk sneller kunt doen.Als je met big data werkt, kom je vaak twee dingen tegen: je gebruikt te veel geheugen en het duurt lang voordat dingen klaar zijn. De Dask-bibliotheek kan je geheugengebruik verminderen door stukjes data alleen te laden als dat echt nodig is. Het kan de looptijd verkorten door al je beschikbare computerkernen tegelijk te gebruiken. Het beste van alles is dat je maar weinig aan je bestaande Python-code hoeft te veranderen.
Grote gestructureerde gegevens analyseren met Dask DataFrames
In deze cursus gebruik je Dask om Spotify-songgegevens te analyseren, afbeeldingen van gebarentaal te verwerken, trends in weergegevens te berekenen, audio-opnames te analyseren en machine learning-modellen te trainen op basis van big data.Je begint met de basis van Dask en ontdekt hoe je met parallelle verwerking in Python bijna elke code sneller kunt maken. Vervolgens ga je kijken naar Dask DataFrames en arrays en hoe je die kunt gebruiken om grote gestructureerde gegevens te analyseren.
Train machine learning-modellen met Dask-ML
Terwijl je de 51 oefeningen in deze cursus doorloopt, leer je hoe je allerlei soorten data kunt verwerken met behulp van Dask bags om met ongestructureerde en gestructureerde data te werken. Tot slot leer je hoe je Dask in Python kunt gebruiken om machine learning-modellen te trainen en je computersnelheid te verbeteren.Vereisten
Data Manipulation with pandasPython Toolbox1
Lui evalueren en parallel computation
In dit hoofdstuk leer je de basis van Dask en lui evalueren. Aan het eind kun je bijna elke Python-code versnellen met parallel processing of multithreading. Je leert het verschil tussen deze twee manieren van taakplanning en wanneer welke beter werkt.
2
Parallel verwerken van grote, gestructureerde data
Hier leer je hoe je grote, gestructureerde data analyseert met Dask-arrays en Dask DataFrames. Je ziet hoe alles wat je kent van NumPy en pandas eenvoudig toepasbaar is op data die te groot is voor het geheugen.
3
Dask Bags voor ongestructureerde data
Verwerk elk type data. Je leert hoe Dask bags efficiënt kunnen worden gebruikt voor ongestructureerde tekstdata, semigestructureerde JSON-data en zelfs opgenomen audio.
4
Dask Machine Learning en de laatste puzzelstukjes
Benut de kracht van Dask om Machine Learning-modellen te trainen. Je leert hoe je met het Dask-ML-pakket modellen op big data traint, en hoe je Dask-berekeningen over een mix van processen en threads verdeelt voor nog meer snelheid.
Parallel programmeren met Dask in Python
Cursus voltooid
Verdien een prestatieverklaring
Voeg deze referentie toe aan je LinkedIn-profiel, cv of curriculum vitaeDeel het op sociale media en in je functioneringsgesprekSchrijf je nu in
Sluit je aan bij meer dan 19 miljoen leerlingen en start vandaag nog met Parallel programmeren met Dask in Python!
Maak je kosteloos account aan
Ga verder met GoogleMeer opties weergevenof
Door verder te gaan accepteer je onze Gebruiksvoorwaarden, ons Privacybeleid en dat je gegevens worden opgeslagen in de VS.
Ontwikkel je datavaardigheden met DataCamp voor Mobiel
Maak vooruitgang onderweg met onze mobiele cursussen en dagelijkse 5-minuten programmeeruitdagingen.