Curso
Programação Paralela com Dask em Python
IntermediárioNível de habilidade
Atualizado 04/2024
PythonProgramming4 h15 vídeos51 Exercícios4,150 XP4,892Declaração de realização
Crie sua conta gratuita
Continuar com o GoogleMostrar mais opçõesou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.
Preferido por alunos de milhares de empresas
Treinando uma equipe?
Experimente para EmpresasDescrição do curso
Use o processamento paralelo para acelerar seu código Python
Com este curso de 4 horas, você vai descobrir como o processamento paralelo com o Dask em Python pode tornar seus fluxos de trabalho mais rápidos.Ao trabalhar com big data, você vai se deparar com dois problemas comuns: usar muita memória e tempos de execução longos. A biblioteca Dask pode reduzir o uso de memória carregando blocos de dados apenas quando necessário. Ele pode reduzir o tempo de execução usando todos os núcleos de computação disponíveis em paralelo. E o melhor de tudo é que você quase não precisa mexer no seu código Python atual.
Analise grandes volumes de dados estruturados usando DataFrame do Dask
Neste curso, você vai usar o Dask para analisar dados de músicas do Spotify, processar imagens de gestos em linguagem de sinais, calcular tendências em dados meteorológicos, analisar gravações de áudio e treinar modelos de machine learning em big data.Você vai começar aprendendo o básico do Dask, vendo como o processamento paralelo no Python pode acelerar quase qualquer código. Depois, você vai conhecer os DataFrame e matrizes do Dask e como usá-los para analisar grandes volumes de dados estruturados.
Treine modelos de machine learning usando o Dask-ML
Conforme você avança pelos 51 exercícios deste curso, você vai aprender a processar qualquer tipo de dado, usando Dask bags para trabalhar com dados não estruturados e estruturados. Por fim, você vai aprender a usar o Dask no Python para treinar modelos de machine learning e melhorar suas velocidades de computação.Pré-requisitos
Data Manipulation with pandasPython Toolbox1
Avaliação preguiçosa e computação paralela
Este capítulo vai ensinar o básico de Dask e avaliação preguiçosa (lazy evaluation). Ao final, você será capaz de acelerar quase qualquer código Python usando processamento paralelo ou multithreading. Você vai aprender a diferença entre esses dois métodos de agendamento de tarefas e qual é melhor em cada situação.
2
Processamento paralelo de dados grandes e estruturados
Aqui você vai aprender a analisar grandes conjuntos de dados estruturados usando Dask arrays e Dask DataFrames. Você verá como tudo o que sabe sobre NumPy e pandas pode ser aplicado facilmente a dados que são grandes demais para caber na memória.
3
Dask Bags para dados não estruturados
Processe qualquer tipo de dado. Você vai aprender como Dask bags podem ser usadas para processar com eficiência dados de texto não estruturados, dados JSON semiestruturados e até áudios gravados.
4
Dask para Machine Learning e peças finais
Aproveite o poder do Dask para treinar modelos de Machine Learning. Você vai aprender a treinar modelos de Machine Learning em big data usando o pacote Dask-ML e como dividir cálculos do Dask entre uma mistura de processos e threads para obter ainda mais velocidade de computação.
Programação Paralela com Dask em Python
Curso concluído
Obtenha um certificado de conclusão
Adicione esta credencial ao seu perfil do LinkedIn, currículo ou CVCompartilhe nas redes sociais e em sua avaliação de desempenhoInscreva-se agora
Faça como mais de 19 milhões de alunos e comece Programação Paralela com Dask em Python hoje mesmo!
Crie sua conta gratuita
Continuar com o GoogleMostrar mais opçõesou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.
Desenvolva suas habilidades em dados com o app do DataCamp
Continue progredindo em qualquer lugar com nossos cursos para celular e desafios diários de programação de 5 minutos.