Cours
Programmation parallèle avec Dask en Python
IntermédiaireNiveau de compétence
Actualisé 04/2024PythonProgramming4 h15 vidéos51 Exercices4,150 XP4,778Certificat de réussite.
Créez votre compte gratuit
ou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.Apprécié par des utilisateurs provenant de milliers d'entreprises
Former 2 personnes ou plus ?
Essayez DataCamp for BusinessDescription du cours
Utilisez le traitement parallèle pour accélérer votre code Python
Au cours de cette formation de 4 heures, vous découvrirez comment le traitement parallèle avec Dask dans Python peut accélérer vos flux de travail.Lorsque vous travaillez avec des données volumineuses, vous rencontrerez deux obstacles courants : une utilisation excessive de la mémoire et des temps d'exécution prolongés. La bibliothèque Dask peut réduire votre utilisation de mémoire en ne chargeant des blocs de données que lorsque cela est nécessaire. Il est possible de réduire les temps d'exécution en utilisant tous les cœurs de processeur disponibles en parallèle. De plus, cela nécessite très peu de modifications de votre code Python existant.
Analysez des données structurées volumineuses à l'aide de Dask DataFrame
Dans ce cours, vous utiliserez Dask pour analyser les données musicales de Spotify, traiter des images de gestes en langue des signes, calculer les tendances météorologiques, analyser des enregistrements audio et former des modèles d'apprentissage automatique sur des mégadonnées.Vous commencerez par acquérir les bases de Dask, en découvrant comment le traitement parallèle en Python peut accélérer la plupart des codes. Ensuite, vous découvrirez les DataFrame et les tableaux Dask, ainsi que leur utilisation pour analyser des données structurées volumineuses.
Entraîner des modèles d'apprentissage automatique à l'aide de Dask-ML
Au fur et à mesure que vous avancerez dans les 51 exercices de ce cours, vous apprendrez à traiter tout type de données, en utilisant les sacs Dask pour travailler avec des données structurées et non structurées. Enfin, vous apprendrez à utiliser Dask dans Python pour former des modèles d'apprentissage automatique et améliorer vos vitesses de calcul.Prérequis
Data Manipulation with pandasPython Toolbox1
Lazy Evaluation and Parallel Computing
This chapter will teach you the basics of Dask and lazy evaluation. At the end of this chapter, you'll be able to speed up almost any Python code by using parallel processing or multi-threading. You'll learn the difference between these two task scheduling methods and which one is better under which circumstances.
2
Parallel Processing of Big, Structured Data
Here you’ll learn how to analyze big structured data using Dask arrays and Dask DataFrames. You'll learn how everything you know about NumPy and pandas can easily be applied to data that is too large to fit in memory.
3
Dask Bags for Unstructured Data
Process any kind of data. You'll learn how Dask bags can be used to efficiently process unstructured text data, semi-structured JSON data, and even recorded audio.
4
Dask Machine Learning and Final Pieces
Harness the power of Dask to train machine learning models. You'll learn how to train machine learning models on big data using the Dask-ML package, and how to split Dask calculations across a mixture of processes and threads for even greater computing speed.
Programmation parallèle avec Dask en Python
Cours terminé
Obtenez un certificat de réussite
Ajoutez cette certification à votre profil LinkedIn, à votre CV ou à votre portfolioPartagez-la sur les réseaux sociaux et dans votre évaluation de performance
Inclus avecPremium or Teams
S'inscrire MaintenantRejoignez plus de 19 millions d'utilisateurs et commencez Programmation parallèle avec Dask en Python dès aujourd'hui !
Créez votre compte gratuit
ou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.