Curso
Programação Paralela com Dask em Python
IntermediárioNível de habilidade
Atualizado 04/2024Iniciar Curso Gratuitamente
Incluído comPremium or Teams
PythonProgramming4 h15 vídeos51 Exercícios4,150 XP4,778Certificado de conclusão
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.Preferido por alunos de milhares de empresas
Treinar 2 ou mais pessoas?
Experimentar DataCamp for BusinessDescrição do curso
Use o processamento paralelo para acelerar seu código Python
Com este curso de 4 horas, você vai descobrir como o processamento paralelo com o Dask em Python pode tornar seus fluxos de trabalho mais rápidos.Ao trabalhar com big data, você vai se deparar com dois problemas comuns: usar muita memória e tempos de execução longos. A biblioteca Dask pode reduzir o uso de memória carregando blocos de dados apenas quando necessário. Ele pode reduzir o tempo de execução usando todos os núcleos de computação disponíveis em paralelo. E o melhor de tudo é que você quase não precisa mexer no seu código Python atual.
Analise grandes volumes de dados estruturados usando DataFrame do Dask
Neste curso, você vai usar o Dask para analisar dados de músicas do Spotify, processar imagens de gestos em linguagem de sinais, calcular tendências em dados meteorológicos, analisar gravações de áudio e treinar modelos de machine learning em big data.Você vai começar aprendendo o básico do Dask, vendo como o processamento paralelo no Python pode acelerar quase qualquer código. Depois, você vai conhecer os DataFrame e matrizes do Dask e como usá-los para analisar grandes volumes de dados estruturados.
Treine modelos de machine learning usando o Dask-ML
Conforme você avança pelos 51 exercícios deste curso, você vai aprender a processar qualquer tipo de dado, usando Dask bags para trabalhar com dados não estruturados e estruturados. Por fim, você vai aprender a usar o Dask no Python para treinar modelos de machine learning e melhorar suas velocidades de computação.Pré-requisitos
Data Manipulation with pandasPython Toolbox1
Lazy Evaluation and Parallel Computing
This chapter will teach you the basics of Dask and lazy evaluation. At the end of this chapter, you'll be able to speed up almost any Python code by using parallel processing or multi-threading. You'll learn the difference between these two task scheduling methods and which one is better under which circumstances.
2
Parallel Processing of Big, Structured Data
Here you’ll learn how to analyze big structured data using Dask arrays and Dask DataFrames. You'll learn how everything you know about NumPy and pandas can easily be applied to data that is too large to fit in memory.
3
Dask Bags for Unstructured Data
Process any kind of data. You'll learn how Dask bags can be used to efficiently process unstructured text data, semi-structured JSON data, and even recorded audio.
4
Dask Machine Learning and Final Pieces
Harness the power of Dask to train machine learning models. You'll learn how to train machine learning models on big data using the Dask-ML package, and how to split Dask calculations across a mixture of processes and threads for even greater computing speed.
Programação Paralela com Dask em Python
Curso concluído
Obtenha um certificado de conclusão
Adicione esta credencial ao seu perfil do LinkedIn, currículo ou CVCompartilhe nas redes sociais e em sua avaliação de desempenho
Incluído comPremium or Teams
Inscreva-se AgoraFaça como mais de 19 milhões de alunos e comece Programação Paralela com Dask em Python hoje mesmo!
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.