Перейти к основному содержимому
ГлавнаяPython

Трек

Профессиональный инженер данных на Python

Обновлено 05.2026
Освойте передовые навыки и современные инструменты, которые сегодня меняют роль data engineer, с нашим треком Professional Data Engineer.
Начать трек бесплатно
PythonИнженерия данных
40 ч
11,898

Создать бесплатный аккаунт

Продолжить через GoogleПоказать больше вариантов

или


Продолжая, вы принимаете наши Условия использования, нашу Политику конфиденциальности и соглашаетесь с тем, что ваши данные хранятся в США.

Любимая обучающимися из тысяч компаний

Group

Обучаете команду?

Попробуйте для бизнеса

Описание трека

Профессиональный инженер данных на Python

Поднимите свои навыки на новый уровень с нашим треком Professional Data Engineer. Этот продвинутый трек предназначен для развития на основе треков Associate Data Engineer in SQL и Data Engineer in Python. Он вооружает вас передовыми знаниями и инструментами, востребованными в современных ролях data engineering. На протяжении этого пути вы освоите современные архитектуры данных, улучшите навыки Python, углубившись в объектно-ориентированное программирование, изучите базы данных NoSQL и научитесь использовать dbt для бесшовной трансформации данных. Откройте секреты DevOps с помощью основных практик, продвинутых методов тестирования и таких инструментов, как Docker, чтобы оптимизировать процессы разработки и развертывания. Погрузитесь в технологии больших данных с PySpark и овладейте обработкой данных и автоматизацией с помощью shell scripting. Применяйте знания на практике в проектах и работайте с реальными наборами данных, чтобы оттачивать навыки, отлаживать сложные рабочие процессы и оптимизировать процессы обработки данных. Пройдя этот трек, вы не только освоите продвинутые навыки, необходимые для решения сложных задач data engineering, но и обретёте уверенность в их применении в динамичном мире data engineering.

Необходимые условия

Инженер данных
  • Course

    1

    Understanding Modern Data Architecture

    Discover modern data architecture's key components, from ingestion and serving to governance and orchestration.

  • Course

    The Unix command line helps users combine existing programs in new ways, automate repetitive tasks, and run programs on clusters and clouds.

  • Course

    This course introduces dbt for data modeling, transformations, testing, and building documentation.

  • Course

    Conquer NoSQL and supercharge data workflows. Learn Snowflake to work with big data, Postgres JSON for handling document data, and Redis for key-value data.

  • Course

    In this Introduction to DevOps, you’ll master the DevOps basics and learn the key concepts, tools, and techniques to improve productivity.

  • Project

    бонус

    Debugging Code

    Sharpen your debugging skills to enhance sales data accuracy.

  • Course

    10

    Introduction to Docker

    Gain an introduction to Docker and discover its importance in the data professional’s toolkit. Learn about Docker containers, images, and more.

  • Course

    Master PySpark to handle big data with ease—learn to process, query, and optimize massive datasets for powerful analytics!

  • Chapter

    This chapter introduces the exciting world of Big Data, as well as the various concepts and different frameworks for processing Big Data. You will understand why Apache Spark is considered the best framework for BigData.

  • Chapter

    The main abstraction Spark provides is a resilient distributed dataset (RDD), which is the fundamental and backbone data type of this engine. This chapter introduces RDDs and shows how RDDs can be created and executed using RDD Transformations and Actions.

  • Chapter

    In this chapter, you'll learn about Spark SQL which is a Spark module for structured data processing. It provides a programming abstraction called DataFrames and can also act as a distributed SQL query engine. This chapter shows how Spark SQL allows you to use DataFrames in Python.

  • Chapter

    In this chapter, we learn how to download data files from web servers via the command line. In the process, we also learn about documentation manuals, option flags, and multi-file processing.

  • Chapter

    In the last chapter, we bridge the connection between command line and other data science languages and learn how they can work together. Using Python as a case study, we learn to execute Python on the command line, to install dependencies using the package manager pip, and to build an entire model pipeline using the command line.

  • Course

    Learn about the difference between batching and streaming, scaling streaming systems, and real-world applications.

  • Course

    Master Apache Kafka! From core concepts to advanced architecture, learn to create, manage, and troubleshoot Kafka for real-world data streaming challenges!

  • Course

    In this course, you will learn the fundamentals of Kubernetes and deploy and orchestrate containers using Manifests and kubectl instructions.

Профессиональный инженер данных на Python
13 Курсов
Трек
завершён

Получить сертификат об окончании

Добавьте эту квалификацию в профиль LinkedIn, резюме или CV
Поделитесь в социальных сетях и в обзоре эффективности
Записаться сейчас

Присоединяйтесь к более чем 19 миллионам обучающихся и начните Профессиональный инженер данных на Python уже сегодня!

Создать бесплатный аккаунт

Продолжить через GoogleПоказать больше вариантов

или


Продолжая, вы принимаете наши Условия использования, нашу Политику конфиденциальности и соглашаетесь с тем, что ваши данные хранятся в США.

Развивайте свои навыки работы с данными с помощью DataCamp для мобильных устройств.

Успевайте в обучении на ходу с помощью наших мобильных курсов и ежедневных 5-минутных заданий по программированию.