Ingénieur professionnel en données en Python

Actualisé 08/2025

Plongez profondément dans les compétences avancées et les outils de pointe qui révolutionnent les rôles d'ingénierie des données aujourd'hui avec notre cursus Professional Data Engineer.

Créez votre compte gratuit

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.

Description du cursus

Ingénieur professionnel en données en Python

Faites passer vos compétences au niveau supérieur grâce à notre cursus d'ingénieur professionnel en données. Ce cursus avancé est conçu pour s'appuyer sur les cursus d'ingénieur de données associé en SQL et d'ingénieur de données en Python. Il vous permet d'acquérir les connaissances et les outils de pointe nécessaires à l'exercice des fonctions modernes d'ingénierie des données. Tout au long de ce parcours, vous maîtriserez les architectures de données modernes, améliorerez vos compétences en Python avec une plongée en profondeur dans la programmation orientée objet, explorerez les bases de données NoSQL et exploiterez la puissance de dbt pour une transformation transparente des données. Découvrez les secrets de DevOps avec des pratiques essentielles, des techniques de test avancées et des outils tels que Docker pour rationaliser vos processus de développement et de déploiement. Plongez dans les technologies big data avec PySpark et atteignez la maîtrise du traitement des données et de l'automatisation à l'aide de scripts shell. Participez à des projets pratiques et attaquez-vous à des ensembles de données du monde réel pour appliquer vos connaissances, déboguer des flux de travail complexes et optimiser les processus de données. En suivant ce cursus, vous acquerrez non seulement les compétences avancées nécessaires pour conquérir des défis complexes en matière d'ingénierie des données, mais aussi la confiance nécessaire pour les appliquer dans le monde dynamique de l'ingénierie des données.

Conditions préalables

Ingénieur de données

Course
1
Comprendre l'architecture moderne des données
Découvrez les composants clés de l'architecture de données moderne, de l'ingestion et du service à la gouvernance et à l'orchestration.
Course
2
Introduction au shell
Course
3
Containerization and Virtualization Concepts
Learn the essentials of VMs, containers, Docker, and Kubernetes. Understand the differences to get started!
Course
4
Introduction to dbt
This course introduces dbt for data modeling, transformations, testing, and building documentation.
Course
5
Introduction à la programmation orientée objet en Python
Découvrez les concepts fondamentaux de la programmation orientée objet (POO), en construisant des classes et des objets personnalisés !
Course
6
Introduction to NoSQL
Conquer NoSQL and supercharge data workflows. Learn Snowflake to work with big data, Postgres JSON for handling document data, and Redis for key-value data.
Course
7
DevOps Concepts
In this Introduction to DevOps, you’ll master the DevOps basics and learn the key concepts, tools, and techniques to improve productivity.
Course
8
Introduction aux tests en Python
Maîtrisez les tests Python : Apprenez des méthodes, créez des vérifications et assurez-vous d'un code sans erreur avec pytest et unittest.
Project
Bonus
Debugging Code
Sharpen your debugging skills to enhance sales data accuracy.
Course
10
Présentation de Docker
Découvrez Docker et son importance dans la boîte à outils du professionnel des données. Découvrez les conteneurs Docker, les images et bien plus encore.
Course
11
Introduction to PySpark
Master PySpark to handle big data with ease—learn to process, query, and optimize massive datasets for powerful analytics!
Chapter
Bonus
Introduction to Big Data analysis with Spark
This chapter introduces the exciting world of Big Data, as well as the various concepts and different frameworks for processing Big Data. You will understand why Apache Spark is considered the best framework for BigData.
Chapter
Bonus
Programming in PySpark RDD’s
The main abstraction Spark provides is a resilient distributed dataset (RDD), which is the fundamental and backbone data type of this engine. This chapter introduces RDDs and shows how RDDs can be created and executed using RDD Transformations and Actions.
Chapter
Bonus
PySpark SQL & DataFrames
In this chapter, you'll learn about Spark SQL which is a Spark module for structured data processing. It provides a programming abstraction called DataFrames and can also act as a distributed SQL query engine. This chapter shows how Spark SQL allows you to use DataFrames in Python.
Project
Bonus
Cleaning an Orders Dataset with PySpark
Step into a data engineer's shoes and master data cleaning with PySpark on an e-commerce orders dataset!
Chapter
Bonus
Downloading Data on the Command Line
In this chapter, we learn how to download data files from web servers via the command line. In the process, we also learn about documentation manuals, option flags, and multi-file processing.
Chapter
Bonus
Data Pipeline on the Command Line
In the last chapter, we bridge the connection between command line and other data science languages and learn how they can work together. Using Python as a case study, we learn to execute Python on the command line, to install dependencies using the package manager pip, and to build an entire model pipeline using the command line.
Course
18
Streaming Concepts
Learn about the difference between batching and streaming, scaling streaming systems, and real-world applications.
Course
19
Introduction to Apache Kafka
Master Apache Kafka! From core concepts to advanced architecture, learn to create, manage, and troubleshoot Kafka for real-world data streaming challenges!
Course
20
Introduction à Kubernetes
Dans ce cours, vous apprendrez les fondamentaux de Kubernetes et à déployer et orchestrer des conteneurs à l'aide de Manifests et d'instructions kubectl.
Resource
Bonus
Impactful Data Engineering—with Datadog's Wouter de Bie
Understand how data engineering can impact your business.

Ingénieur professionnel en données en Python

13 Cours

Piste
terminée

Obtenez un certificat de réussite

Ajoutez ces informations d’identification à votre profil LinkedIn, à votre CV ou à votre CV
Partagez-le sur les réseaux sociaux et dans votre évaluation de performance

Inclus avecPremium or Teams

S'inscrire Maintenant

Rejoignez plus de 18 millions d'utilisateurs et commencez Ingénieur professionnel en données en Python dès aujourd'hui !

Créez votre compte gratuit

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.

Description du cursus

Ingénieur professionnel en données en Python

Obtenez un certificat de réussite

Rejoignez plus de .css-nklxlk{color:var(--wf-brand--main, #03EF62);}18 millions d'utilisateurs et commencez Ingénieur professionnel en données en Python dès aujourd'hui !

Créez votre compte gratuit

Rejoignez plus de 18 millions d'utilisateurs et commencez Ingénieur professionnel en données en Python dès aujourd'hui !