Curso
Programación paralela con Dask en Python
IntermedioNivel de habilidad
Actualizado 4/2024Comienza El Curso Gratis
Incluido conPremium or Teams
PythonProgramming4 h15 vídeos51 Ejercicios4,150 XP4,778Certificado de logros
Crea Tu Cuenta Gratuita
o
Al continuar, aceptas nuestros Términos de uso, nuestra Política de privacidad y que tus datos se almacenen en los EE. UU.Preferido por estudiantes en miles de empresas
¿Formar a 2 o más personas?
Probar DataCamp for BusinessDescripción del curso
Utiliza el procesamiento paralelo para acelerar tu código Python
Con este curso de 4 horas, descubrirás cómo el procesamiento paralelo con Dask en Python puede acelerar tus flujos de trabajo.Al trabajar con big data, te encontrarás con dos obstáculos comunes: el uso excesivo de memoria y los largos tiempos de ejecución. La biblioteca Dask puede reducir el uso de memoria cargando fragmentos de datos solo cuando sea necesario. Puede reducir los tiempos de ejecución utilizando todos los núcleos informáticos disponibles en paralelo. Lo mejor de todo es que requiere muy pocos cambios en tu código Python actual.
Analizar grandes volúmenes de datos estructurados utilizando Dask DataFrame
En este curso, utilizarás Dask para analizar datos de canciones de Spotify, procesar imágenes de gestos en lenguaje de signos, calcular tendencias en datos meteorológicos, analizar grabaciones de audio y entrenar modelos de machine learning con big data.Comenzarás aprendiendo los conceptos básicos de Dask y descubriendo cómo el procesamiento paralelo en Python puede acelerar casi cualquier código. A continuación, explorarás Dask DataFrame y arreglos, y cómo utilizarlos para analizar grandes volúmenes de datos estructurados.
Entrena modelos de machine learning con Dask-ML.
A medida que avances en los 51 ejercicios de este curso, aprenderás a procesar cualquier tipo de datos, utilizando Dask bags para trabajar con datos estructurados y no estructurados. Por último, aprenderás a utilizar Dask en Python para entrenar modelos de machine learning y mejorar tu velocidad de cálculo.Requisitos previos
Data Manipulation with pandasPython Toolbox1
Lazy Evaluation and Parallel Computing
This chapter will teach you the basics of Dask and lazy evaluation. At the end of this chapter, you'll be able to speed up almost any Python code by using parallel processing or multi-threading. You'll learn the difference between these two task scheduling methods and which one is better under which circumstances.
2
Parallel Processing of Big, Structured Data
Here you’ll learn how to analyze big structured data using Dask arrays and Dask DataFrames. You'll learn how everything you know about NumPy and pandas can easily be applied to data that is too large to fit in memory.
3
Dask Bags for Unstructured Data
Process any kind of data. You'll learn how Dask bags can be used to efficiently process unstructured text data, semi-structured JSON data, and even recorded audio.
4
Dask Machine Learning and Final Pieces
Harness the power of Dask to train machine learning models. You'll learn how to train machine learning models on big data using the Dask-ML package, and how to split Dask calculations across a mixture of processes and threads for even greater computing speed.
Programación paralela con Dask en Python
Curso completo
Obtener certificado de logros
Añade esta certificación a tu perfil de LinkedIn o a tu currículum.Compártelo en redes sociales y en tu evaluación de desempeño.
Incluido conPremium or Teams
Inscríbete Ahora¡Únete a 19 millones de estudiantes y empieza Programación paralela con Dask en Python hoy mismo!
Crea Tu Cuenta Gratuita
o
Al continuar, aceptas nuestros Términos de uso, nuestra Política de privacidad y que tus datos se almacenen en los EE. UU.