Pular para o conteúdo principal

Curso

ETL e ELT em Python

IntermediárioNível de habilidade

Atualizado 01/2026

Aprenda a criar pipelines de dados eficazes, eficientes e confiáveis usando os princípios de extração, transformação e carregamento.

Iniciar curso gratuitamente

PythonData Engineering

4 h

14 vídeos

53 Exercícios

4,450 XP

37,255

Declaração de realização

Preferido por alunos de milhares de empresas

Treinando uma equipe?

Experimente para Empresas

Descrição do curso

Capacitando a análise com pipelines de dados

Os pipelines de dados são a base de toda plataforma de dados sólida. A criação desses pipelines é uma habilidade essencial para os engenheiros de dados, que fornecem um valor incrível para uma empresa pronta para entrar em um futuro orientado por dados. Este curso introdutório ajudará você a aprimorar as habilidades para criar pipelines de dados eficazes, eficientes e confiáveis.

Criação e manutenção de soluções ETL

Ao longo deste curso, você mergulhará no processo completo de criação de um pipeline de dados. Você desenvolverá suas habilidades utilizando bibliotecas Python, como pandas e json, para extrair dados de fontes estruturadas e não estruturadas antes de serem transformados e mantidos para uso posterior. Ao longo do caminho, você desenvolverá ferramentas e técnicas de confiança, como diagramas de arquitetura, testes unitários e monitoramento, que ajudarão a diferenciar seus pipelines de dados dos demais. À medida que progredir, você colocará suas novas habilidades à prova com exercícios práticos.

Superalimente os fluxos de trabalho de dados

Após concluir este curso, você estará pronto para projetar, desenvolver e usar pipelines de dados para turbinar o fluxo de trabalho de dados em seu emprego, nova carreira ou projeto pessoal.

Pré-requisitos

Data Warehousing Concepts Streamlined Data Ingestion with pandas

1

Introduction to Data Pipelines

Get ready to discover how data is collected, processed, and moved using data pipelines. You will explore the qualities of the best data pipelines, and prepare to design and build your own.

Introduction to ETL and ELT Pipelines

Running an ETL Pipeline

ELT in Action

ETL and ELT Pipelines

Building ETL and ELT Pipelines

Building an ETL Pipeline

The "T" in ELT

Extracting, Transforming, and Loading Student Scores Data

Iniciar capítulo

2

Building ETL Pipelines

Dive into leveraging pandas to extract, transform, and load data as you build your first data pipelines. Learn how to make your ETL logic reusable, and apply logging and exception handling to your pipelines.

Extracting data from structured sources

Extracting data from parquet files

Pulling data from SQL databases

Building functions to extract data

Transforming data with pandas

Filtering pandas DataFrames

Transforming sales data with pandas

Validating data transformations

Persisting data with pandas

Loading sales data to a CSV file

Customizing a CSV file

Persisting data to files

Monitoring a data pipeline

Logging within a data pipeline

Handling exceptions when loading data

Monitoring and alerting within a data pipeline

Iniciar capítulo

3

Advanced ETL Techniques

Supercharge your workflow with advanced data pipelining techniques, such as working with non-tabular data and persisting DataFrames to SQL databases. Discover tooling to tackle advanced transformations with pandas, and uncover best-practices for working with complex data.

Extracting non-tabular data

Ingesting JSON data with pandas

Reading JSON data into memory

Transforming non-tabular data

Iterating over dictionaries

Parsing data from dictionaries

Transforming JSON data

Transforming and cleaning DataFrames

Advanced data transformation with pandas

Filling missing values with pandas

Grouping data with pandas

Applying advanced transformations to DataFrames

Loading data to a SQL database with pandas

Loading data to a Postgres database

Validating data loaded to a Postgres Database

Iniciar capítulo

4

Deploying and Maintaining a Data Pipeline

In this final chapter, you’ll create frameworks to validate and test data pipelines before shipping them into production. After you’ve tested your pipeline, you’ll explore techniques to run your data pipeline end-to-end, all while allowing for visibility into pipeline performance.

Manually testing a data pipeline

Testing data pipelines

Validating a data pipeline at "checkpoints"

Testing a data pipeline end-to-end

Unit-testing a data pipeline

Validating a data pipeline with assert

Writing unit tests with pytest

Creating fixtures with pytest

Unit testing a data pipeline with fixtures

Running a data pipeline in production

Orchestration and ETL tools

Data pipeline architecture patterns

Running a data pipeline end-to-end

Congratulations!

Iniciar capítulo

ETL e ELT em Python

Curso
concluído

Obtenha um certificado de conclusão

Adicione esta credencial ao seu perfil do LinkedIn, currículo ou CV
Compartilhe nas redes sociais e em sua avaliação de desempenhoInscreva-se agora

Faça como mais de 19 milhões de alunos e comece ETL e ELT em Python hoje mesmo!

Desenvolva suas habilidades em dados com o app do DataCamp

Continue progredindo em qualquer lugar com nossos cursos para celular e desafios diários de programação de 5 minutos.