Ścieżka
Profesjonalny inżynier danych w Pythonie
Utwórz bezpłatne konto
Kontynuuj z GooglePokaż więcej opcjilub
Uwielbiany przez kursantów z tysięcy firm
Szkolisz zespół?
Wypróbuj dla firmOpis ścieżki
Profesjonalny inżynier danych w Pythonie
Wymagania wstępne
Inżynier danychCourse
Poznaj kluczowe elementy nowoczesnej architektury danych — od ingestion i serving po governance i orchestration.
Course
Unix command line pomaga łączyć istniejące programy w nowe sposoby, automatyzować powtarzalne zadania i uruchamiać programy na klastrach i w chmurach.
Course
Poznaj podstawy VM, kontenerów, Dockera i Kubernetes. Poznaj różnice, aby zacząć!
Course
Ten kurs wprowadza dbt do modelowania danych, transformacji, testowania i tworzenia dokumentacji.
Course
Poznaj podstawy programowania obiektowego (OOP), tworząc własne klasy i obiekty!
Course
Course
W tym wprowadzeniu do DevOps opanujesz podstawy DevOps i poznasz kluczowe pojęcia, narzędzia oraz techniki zwiększające produktywność.
Course
Opanuj testowanie w Pythonie: Poznaj metody, twórz testy i zapewnij kod bez błędów dzięki pytest i unittest.
Project
bonusDebugging Code
Sharpen your debugging skills to enhance sales data accuracy.
Course
Poznaj Docker i odkryj jego znaczenie w zestawie narzędzi specjalisty ds. danych. Poznaj kontenery Docker, obrazy i nie tylko.
Course
Opanuj PySpark, by z łatwością obsługiwać big data — ucz się przetwarzać, zapytywać i optymalizować ogromne zbiory danych do zaawansowanej analityki!
Chapter
This chapter introduces the exciting world of Big Data, as well as the various concepts and different frameworks for processing Big Data. You will understand why Apache Spark is considered the best framework for BigData.
Chapter
The main abstraction Spark provides is a resilient distributed dataset (RDD), which is the fundamental and backbone data type of this engine. This chapter introduces RDDs and shows how RDDs can be created and executed using RDD Transformations and Actions.
Chapter
In this chapter, you'll learn about Spark SQL which is a Spark module for structured data processing. It provides a programming abstraction called DataFrames and can also act as a distributed SQL query engine. This chapter shows how Spark SQL allows you to use DataFrames in Python.
Project
Step into a data engineer's shoes and master data cleaning with PySpark on an e-commerce orders dataset!
Chapter
In this chapter, we learn how to download data files from web servers via the command line. In the process, we also learn about documentation manuals, option flags, and multi-file processing.
Chapter
In the last chapter, we bridge the connection between command line and other data science languages and learn how they can work together. Using Python as a case study, we learn to execute Python on the command line, to install dependencies using the package manager pip, and to build an entire model pipeline using the command line.
Course
Poznaj różnice między przetwarzaniem wsadowym a strumieniowym, skalowaniem systemów strumieniowych i zastosowaniami w praktyce.
Course
Opanuj Apache Kafka! Od podstaw po zaawansowaną architekturę: naucz się tworzyć, zarządzać i diagnozować Kafka w realnych wyzwaniach streamingu danych!
Course
W tym kursie poznasz podstawy Kubernetes oraz wdrażanie i orkiestrację kontenerów za pomocą Manifestów i poleceń kubectl.
Resource
Understand how data engineering can impact your business.
ukończona
Zdobądź zaświadczenie o ukończeniu
Dodaj to poświadczenie do swojego profilu LinkedIn, CV lub życiorysuUdostępnij to w mediach społecznościowych i podczas oceny wyników pracyZapisz się teraz
Dołącz do ponad 19 milionów kursantów i zacznij Profesjonalny inżynier danych w Pythonie już dziś!
Utwórz bezpłatne konto
Kontynuuj z GooglePokaż więcej opcjilub
Rozwijaj swoje umiejętności w zakresie danych dzięki DataCamp dla urządzeń mobilnych
Rób postępy w podróży dzięki naszym kursom mobilnym i codziennym 5-minutowym wyzwaniom kodowania.