Profesjonalny inżynier danych w Pythonie

Zaktualizowano 05.2026

Zanurz się głęboko w zaawansowane umiejętności i najnowocześniejsze narzędzia, które rewolucjonizują dziś role inżyniera danych, dzięki naszemu trackowi Professional Data Engineer.

Opis ścieżki

Profesjonalny inżynier danych w Pythonie

Przenieś swoje umiejętności na wyższy poziom dzięki naszemu trackowi Professional Data Engineer. Ten zaawansowany track został zaprojektowany jako rozwinięcie ścieżek Associate Data Engineer in SQL oraz Data Engineer in Python. Wyposaża Cię w najnowocześniejszą wiedzę i narzędzia wymagane na współczesnych stanowiskach data engineering. Podczas tej ścieżki opanujesz nowoczesne architektury danych, rozwiniesz swoje umiejętności w Pythonie dzięki dogłębnemu poznaniu programowania obiektowego, poznasz bazy danych NoSQL i wykorzystasz moc dbt do płynnej transformacji danych. Odblokuj tajniki DevOps dzięki kluczowym praktykom, zaawansowanym technikom testowania i narzędziom takim jak Docker, aby usprawnić procesy tworzenia i wdrażania. Zanurz się w technologiach big data z PySpark i osiągnij biegłość w przetwarzaniu danych oraz automatyzacji dzięki skryptom powłoki. Zaangażuj się w praktyczne projekty i pracuj na rzeczywistych zbiorach danych, aby zastosować swoją wiedzę, debugować złożone przepływy pracy i optymalizować procesy danych. Ukończając tę ścieżkę, zdobędziesz nie tylko zaawansowane umiejętności potrzebne do pokonywania złożonych wyzwań inżynierii danych, ale także pewność siebie, by stosować je w dynamicznym świecie inżynierii danych.

Wymagania wstępne

Inżynier danych

Course
1
Nowoczesna architektura danych
Poznaj kluczowe elementy nowoczesnej architektury danych — od ingestion i serving po governance i orchestration.
Course
2
Wprowadzenie do powłoki systemowej
Unix command line pomaga łączyć istniejące programy w nowe sposoby, automatyzować powtarzalne zadania i uruchamiać programy na klastrach i w chmurach.
Course
3
Konteneryzacja i wirtualizacja – podstawy
Poznaj podstawy VM, kontenerów, Dockera i Kubernetes. Poznaj różnice, aby zacząć!
Course
4
Wprowadzenie do dbt
Ten kurs wprowadza dbt do modelowania danych, transformacji, testowania i tworzenia dokumentacji.
Course
5
Wprowadzenie do programowania obiektowego w Pythonie
Poznaj podstawy programowania obiektowego (OOP), tworząc własne klasy i obiekty!
Course
6
Wprowadzenie do NoSQL
Course
7
Koncepcje DevOps
W tym wprowadzeniu do DevOps opanujesz podstawy DevOps i poznasz kluczowe pojęcia, narzędzia oraz techniki zwiększające produktywność.
Course
8
Wprowadzenie do testowania w Pythonie
Opanuj testowanie w Pythonie: Poznaj metody, twórz testy i zapewnij kod bez błędów dzięki pytest i unittest.
Project
bonus
Debugging Code
Sharpen your debugging skills to enhance sales data accuracy.
Course
10
Wprowadzenie do Dockera
Poznaj Docker i odkryj jego znaczenie w zestawie narzędzi specjalisty ds. danych. Poznaj kontenery Docker, obrazy i nie tylko.
Course
11
Wprowadzenie do PySpark
Opanuj PySpark, by z łatwością obsługiwać big data — ucz się przetwarzać, zapytywać i optymalizować ogromne zbiory danych do zaawansowanej analityki!
Chapter
bonus
Introduction to Big Data analysis with Spark
This chapter introduces the exciting world of Big Data, as well as the various concepts and different frameworks for processing Big Data. You will understand why Apache Spark is considered the best framework for BigData.
Chapter
bonus
Programming in PySpark RDD’s
The main abstraction Spark provides is a resilient distributed dataset (RDD), which is the fundamental and backbone data type of this engine. This chapter introduces RDDs and shows how RDDs can be created and executed using RDD Transformations and Actions.
Chapter
bonus
PySpark SQL & DataFrames
In this chapter, you'll learn about Spark SQL which is a Spark module for structured data processing. It provides a programming abstraction called DataFrames and can also act as a distributed SQL query engine. This chapter shows how Spark SQL allows you to use DataFrames in Python.
Project
bonus
Cleaning an Orders Dataset with PySpark
Step into a data engineer's shoes and master data cleaning with PySpark on an e-commerce orders dataset!
Chapter
bonus
Downloading Data on the Command Line
In this chapter, we learn how to download data files from web servers via the command line. In the process, we also learn about documentation manuals, option flags, and multi-file processing.
Chapter
bonus
Data Pipeline on the Command Line
In the last chapter, we bridge the connection between command line and other data science languages and learn how they can work together. Using Python as a case study, we learn to execute Python on the command line, to install dependencies using the package manager pip, and to build an entire model pipeline using the command line.
Course
18
Koncepcje strumieniowania danych
Poznaj różnice między przetwarzaniem wsadowym a strumieniowym, skalowaniem systemów strumieniowych i zastosowaniami w praktyce.
Course
19
Wprowadzenie do Apache Kafka
Opanuj Apache Kafka! Od podstaw po zaawansowaną architekturę: naucz się tworzyć, zarządzać i diagnozować Kafka w realnych wyzwaniach streamingu danych!
Course
20
Wprowadzenie do Kubernetes
W tym kursie poznasz podstawy Kubernetes oraz wdrażanie i orkiestrację kontenerów za pomocą Manifestów i poleceń kubectl.
Resource
bonus
Impactful Data Engineering—with Datadog's Wouter de Bie
Understand how data engineering can impact your business.

Profesjonalny inżynier danych w Pythonie

13 Kursów

Ścieżka
ukończona

Zdobądź zaświadczenie o ukończeniu

Dodaj to poświadczenie do swojego profilu LinkedIn, CV lub życiorysu
Udostępnij to w mediach społecznościowych i podczas oceny wyników pracyZapisz się teraz

Profesjonalny inżynier danych w Pythonie

Szkolisz zespół?

Opis ścieżki

Profesjonalny inżynier danych w Pythonie

Wymagania wstępne

Nowoczesna architektura danych

Wprowadzenie do powłoki systemowej

Konteneryzacja i wirtualizacja – podstawy

Wprowadzenie do dbt

Wprowadzenie do programowania obiektowego w Pythonie

Wprowadzenie do NoSQL

Koncepcje DevOps

Wprowadzenie do testowania w Pythonie

Debugging Code

Wprowadzenie do Dockera

Wprowadzenie do PySpark

Introduction to Big Data analysis with Spark

Programming in PySpark RDD’s

PySpark SQL & DataFrames

Cleaning an Orders Dataset with PySpark

Downloading Data on the Command Line

Data Pipeline on the Command Line

Koncepcje strumieniowania danych

Wprowadzenie do Apache Kafka

Wprowadzenie do Kubernetes

Impactful Data Engineering—with Datadog's Wouter de Bie

Zdobądź zaświadczenie o ukończeniu

Dołącz do ponad 19 milionów kursantów i zacznij Profesjonalny inżynier danych w Pythonie już dziś!

Rozwijaj swoje umiejętności w zakresie danych dzięki DataCamp dla urządzeń mobilnych

Opis ścieżki

Profesjonalny inżynier danych w Pythonie

Zdobądź zaświadczenie o ukończeniu

Dołącz do ponad .css-nklxlk{color:var(--wf-brand--main, #03EF62);}19 milionów kursantów i zacznij Profesjonalny inżynier danych w Pythonie już dziś!

Utwórz bezpłatne konto

Rozwijaj swoje umiejętności w zakresie danych dzięki DataCamp dla urządzeń mobilnych

Dołącz do ponad 19 milionów kursantów i zacznij Profesjonalny inżynier danych w Pythonie już dziś!