Curso
Programación paralela con Dask en Python
IntermedioNivel de habilidad
Actualizado 4/2024Comienza El Curso Gratis
Incluido conPremium or Teams
PythonProgramming4 h15 vídeos51 Ejercicios4,150 XP4,767Certificado de logros
Crea Tu Cuenta Gratuita
o
Al continuar, aceptas nuestros Términos de uso, nuestra Política de privacidad y que tus datos se almacenen en los EE. UU.Preferido por estudiantes en miles de empresas
¿Formar a 2 o más personas?
Probar DataCamp for BusinessDescripción del curso
Utiliza el procesamiento paralelo para acelerar tu código Python
Con este curso de 4 horas, descubrirás cómo el procesamiento paralelo con Dask en Python puede acelerar tus flujos de trabajo.Al trabajar con big data, te encontrarás con dos obstáculos comunes: el uso excesivo de memoria y los largos tiempos de ejecución. La biblioteca Dask puede reducir el uso de memoria cargando fragmentos de datos solo cuando sea necesario. Puede reducir los tiempos de ejecución utilizando todos los núcleos informáticos disponibles en paralelo. Lo mejor de todo es que requiere muy pocos cambios en tu código Python actual.
Analizar grandes volúmenes de datos estructurados utilizando Dask DataFrame
En este curso, utilizarás Dask para analizar datos de canciones de Spotify, procesar imágenes de gestos en lenguaje de signos, calcular tendencias en datos meteorológicos, analizar grabaciones de audio y entrenar modelos de machine learning con big data.Comenzarás aprendiendo los conceptos básicos de Dask y descubriendo cómo el procesamiento paralelo en Python puede acelerar casi cualquier código. A continuación, explorarás Dask DataFrame y arreglos, y cómo utilizarlos para analizar grandes volúmenes de datos estructurados.
Entrena modelos de machine learning con Dask-ML.
A medida que avances en los 51 ejercicios de este curso, aprenderás a procesar cualquier tipo de datos, utilizando Dask bags para trabajar con datos estructurados y no estructurados. Por último, aprenderás a utilizar Dask en Python para entrenar modelos de machine learning y mejorar tu velocidad de cálculo.Requisitos previos
Data Manipulation with pandasPython Toolbox1
Evaluación perezosa y computación en paralelo
En este capítulo aprenderás los fundamentos de Dask y la evaluación perezosa. Al terminar, podrás acelerar casi cualquier código de Python usando procesamiento en paralelo o multihilo. Verás la diferencia entre estos dos métodos de planificación de tareas y cuál conviene en cada situación.
2
Procesamiento en paralelo de datos grandes y estructurados
Aquí aprenderás a analizar grandes datos estructurados usando Dask arrays y Dask DataFrames. Verás cómo todo lo que ya sabes de NumPy y pandas puede aplicarse fácilmente a datos que son demasiado grandes para caber en memoria.
3
Dask Bags para datos no estructurados
Procesa cualquier tipo de datos. Verás cómo los Dask bags pueden usarse para procesar de forma eficiente datos de texto no estructurados, datos JSON semiestructurados e incluso audio grabado.
4
Machine Learning con Dask y piezas finales
Aprovecha la potencia de Dask para entrenar modelos de Machine Learning. Aprenderás a entrenar modelos de Machine Learning con big data usando el paquete Dask-ML y a dividir cálculos de Dask entre una combinación de procesos e hilos para lograr aún más velocidad de cómputo.
Programación paralela con Dask en Python
Curso completo
Obtener certificado de logros
Añade esta certificación a tu perfil de LinkedIn o a tu currículum.Compártelo en redes sociales y en tu evaluación de desempeño.
Incluido conPremium or Teams
Inscríbete Ahora¡Únete a 19 millones de estudiantes y empieza Programación paralela con Dask en Python hoy mismo!
Crea Tu Cuenta Gratuita
o
Al continuar, aceptas nuestros Términos de uso, nuestra Política de privacidad y que tus datos se almacenen en los EE. UU.