跳至内容
首页Python

学习路径

专业数据工程师 在 Python 中

更新时间 2026年5月
深入掌握先进技能和前沿工具,借助我们的专业数据工程师学习路径,革新当今的数据工程岗位。
免费开始学习路径
Python数据工程
40小时
11,898

创建您的免费帐户

继续使用 Google显示更多选项


继续操作即表示您接受我们的《使用条款》和《隐私政策》,并同意您的数据存储在美国。

深受数千家公司学习者的喜爱

Group

需要团队培训?

企业版试用

学习路径描述

专业数据工程师 在 Python 中

通过我们的专业数据工程师学习路径,将你的技能提升到新水平。 此高级路径旨在在 SQL 数据工程师和 Python 数据工程师初级路径的基础上进一步提升。 它为你提供现代数据工程岗位所需的前沿知识和工具。 在这段学习旅程中,你将掌握现代数据架构,通过深入学习面向对象编程提升你的 Python 技能,探索 NoSQL 数据库,并运用 dbt 的强大功能实现无缝数据转换。 通过实践、先进的测试技术以及 Docker 等工具,解锁 DevOps 的奥秘,简化你的开发和部署流程。 沉浸于大数据技术,借助 PySpark 掌握数据处理与自动化,并使用 shell 脚本实现精通。 通过动手项目和真实世界数据集来应用你的知识、调试复杂工作流并优化数据流程。 完成此学习路径后,您不仅将掌握攻克复杂数据工程挑战所需的高级技能,还将获得在充满活力的数据工程领域中应用这些技能的信心。

先决条件

数据工程师
  • Course

    1

    Understanding Modern Data Architecture

    Discover modern data architecture's key components, from ingestion and serving to governance and orchestration.

  • Course

    Unix 命令行帮助用户以新方式组合现有程序、自动化重复任务,并在集群和云上运行程序。

  • Course

    本课程介绍 dbt,用于数据建模、转换、测试和构建文档。

  • Course

    Conquer NoSQL and supercharge data workflows. Learn Snowflake to work with big data, Postgres JSON for handling document data, and Redis for key-value data.

  • Course

    In this Introduction to DevOps, you’ll master the DevOps basics and learn the key concepts, tools, and techniques to improve productivity.

  • Project

    额外

    Debugging Code

    Sharpen your debugging skills to enhance sales data accuracy.

  • Course

    10

    Docker 入门

    了解 Docker 入门,掌握它在数据专业人士工具箱中的重要性。 了解 Docker 容器、镜像等内容。

  • Course

    精通 PySpark,轻松处理大数据——学习处理、查询和优化海量数据集,释放强大分析能力!

  • Chapter

    This chapter introduces the exciting world of Big Data, as well as the various concepts and different frameworks for processing Big Data. You will understand why Apache Spark is considered the best framework for BigData.

  • Chapter

    The main abstraction Spark provides is a resilient distributed dataset (RDD), which is the fundamental and backbone data type of this engine. This chapter introduces RDDs and shows how RDDs can be created and executed using RDD Transformations and Actions.

  • Chapter

    In this chapter, you'll learn about Spark SQL which is a Spark module for structured data processing. It provides a programming abstraction called DataFrames and can also act as a distributed SQL query engine. This chapter shows how Spark SQL allows you to use DataFrames in Python.

  • Chapter

    In this chapter, we learn how to download data files from web servers via the command line. In the process, we also learn about documentation manuals, option flags, and multi-file processing.

  • Chapter

    In the last chapter, we bridge the connection between command line and other data science languages and learn how they can work together. Using Python as a case study, we learn to execute Python on the command line, to install dependencies using the package manager pip, and to build an entire model pipeline using the command line.

  • Course

    Learn about the difference between batching and streaming, scaling streaming systems, and real-world applications.

  • Course

    Master Apache Kafka! From core concepts to advanced architecture, learn to create, manage, and troubleshoot Kafka for real-world data streaming challenges!

  • Course

    In this course, you will learn the fundamentals of Kubernetes and deploy and orchestrate containers using Manifests and kubectl instructions.

专业数据工程师 在 Python 中
13 课程
学习路径完成

获得成就证明

将此证书添加到您的 LinkedIn 档案、简历或履历中
在社交媒体和绩效评估中分享
立即注册

加入超过19百万学习者,今天就开始专业数据工程师 在 Python 中!

创建您的免费帐户

继续使用 Google显示更多选项


继续操作即表示您接受我们的《使用条款》和《隐私政策》,并同意您的数据存储在美国。

通过 DataCamp for Mobile 提升您的数据技能

随时随地通过我们的移动课程和每日 5 分钟编程挑战提升技能。