Lộ trình
Kỹ sư dữ liệu chuyên nghiệp trong Python
Tạo tài khoản miễn phí
hoặc
Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.Được yêu thích bởi học viên tại hàng nghìn công ty
Đào tạo 2 người trở lên?
Thử DataCamp for BusinessMô tả track
Kỹ sư dữ liệu chuyên nghiệp trong Python
Điều kiện tiên quyết
Kỹ sư dữ liệuCourse
Khám phá các thành phần chính của kiến trúc dữ liệu hiện đại, từ thu thập và phục vụ đến quản trị và điều phối.
Course
Course
Tìm hiểu những kiến thức cơ bản về VM, container, Docker và Kubernetes. Hiểu sự khác biệt để bắt đầu!
Course
Khóa học này giới thiệu dbt cho việc mô hình hóa dữ liệu, chuyển đổi, kiểm thử và xây dựng tài liệu.
Course
Khám phá các khái niệm cơ bản của lập trình hướng đối tượng (OOP), xây dựng các lớp và đối tượng tùy chỉnh!
Course
Course
Course
Project
thưởngDebugging Code
Sharpen your debugging skills to enhance sales data accuracy.
Course
Tìm hiểu về Docker và khám phá tầm quan trọng của nó trong bộ công cụ của chuyên gia dữ liệu. Tìm hiểu về Docker container, Docker image và nhiều nội dung khác.
Course
Thành thạo PySpark để xử lý big data dễ dàng—học cách xử lý, truy vấn và tối ưu hóa các bộ dữ liệu khổng lồ cho phân tích mạnh mẽ!
Chapter
This chapter introduces the exciting world of Big Data, as well as the various concepts and different frameworks for processing Big Data. You will understand why Apache Spark is considered the best framework for BigData.
Chapter
The main abstraction Spark provides is a resilient distributed dataset (RDD), which is the fundamental and backbone data type of this engine. This chapter introduces RDDs and shows how RDDs can be created and executed using RDD Transformations and Actions.
Chapter
thưởngPySpark SQL & DataFrames
In this chapter, you'll learn about Spark SQL which is a Spark module for structured data processing. It provides a programming abstraction called DataFrames and can also act as a distributed SQL query engine. This chapter shows how Spark SQL allows you to use DataFrames in Python.
Project
Step into a data engineer's shoes and master data cleaning with PySpark on an e-commerce orders dataset!
Chapter
In this chapter, we learn how to download data files from web servers via the command line. In the process, we also learn about documentation manuals, option flags, and multi-file processing.
Chapter
In the last chapter, we bridge the connection between command line and other data science languages and learn how they can work together. Using Python as a case study, we learn to execute Python on the command line, to install dependencies using the package manager pip, and to build an entire model pipeline using the command line.
Course
Course
Course
Resource
Understand how data engineering can impact your business.
Thành
Nhận Giấy Chứng Nhận Hoàn Thành
Thêm chứng chỉ này vào hồ sơ LinkedIn, CV hoặc sơ yếu lý lịch của banChia sẻ trên mạng xã hội và trong đánh giá hiệu suất của banĐăng Ký Ngay
Tham gia cùng hơn 19 triệu học viên và bắt đầu Kỹ sư dữ liệu chuyên nghiệp trong Python ngay hôm nay!
Tạo tài khoản miễn phí
hoặc
Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.Phát triển kỹ năng dữ liệu với DataCamp cho thiết bị di động
Tiến bộ mọi lúc mọi nơi với các khóa học cho thiết bị di động và thử thách lập trình 5 phút hằng ngày.