Khóa học
Làm sạch dữ liệu với Python
Trung cấpTrình độ kỹ năng
Đã cập nhật tháng 12, 2025Bắt Đầu Khóa Học Miễn Phí
Bao gồm vớiCao cấp or Đội nhóm
PythonData Preparation4 giờ13 video44 Bài tập3,500 XP150K+Giấy Chứng Nhận Thành Tích
Tạo tài khoản miễn phí
hoặc
Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.Được yêu thích bởi học viên tại hàng nghìn công ty
Đào tạo 2 người trở lên?
Thử DataCamp for BusinessMô tả khóa học
Khám phá cách làm sạch dữ liệu trong Python
Thường được cho rằng các nhà khoa học dữ liệu dành 80% thời gian của họ cho việc làm sạch và xử lý dữ liệu, và chỉ 20% thời gian còn lại cho việc phân tích dữ liệu. Việc làm sạch dữ liệu là một bước quan trọng đối với mọi nhà khoa học dữ liệu, vì việc phân tích dữ liệu không chính xác có thể dẫn đến kết luận sai lệch.Trong khóa học này, quý vị sẽ học cách xác định, chẩn đoán và xử lý các vấn đề liên quan đến làm sạch dữ liệu trong Python, từ cơ bản đến nâng cao. Quý vị sẽ xử lý các loại dữ liệu không phù hợp, kiểm tra xem dữ liệu có nằm trong phạm vi chính xác hay không, xử lý dữ liệu thiếu, thực hiện liên kết bản ghi và nhiều tác vụ khác!
Hướng dẫn cách làm sạch các loại dữ liệu khác nhau
Chương đầu tiên của khóa học sẽ phân tích các vấn đề dữ liệu phổ biến và cách giải quyết chúng. Quý vị sẽ bắt đầu bằng việc nắm vững các kiểu dữ liệu cơ bản và cách xử lý từng loại một cách riêng biệt. Sau đó, quý vị sẽ áp dụng các giới hạn phạm vi và loại bỏ các điểm dữ liệu trùng lặp.Chương cuối cùng trình bày về kỹ thuật liên kết dữ liệu, một công cụ mạnh mẽ để hợp nhất nhiều bộ dữ liệu. Quý vị sẽ học cách liên kết các bản ghi bằng cách tính toán mức độ tương đồng giữa các chuỗi ký tự. Cuối cùng, quý vị sẽ áp dụng các kỹ năng mới học được để kết hợp hai bộ dữ liệu đánh giá nhà hàng thành một bộ dữ liệu chính thống nhất và sạch sẽ.
Tăng cường sự tự tin trong việc làm sạch dữ liệu
Sau khi hoàn thành khóa học, quý vị sẽ có đủ tự tin để xử lý dữ liệu từ các nguồn khác nhau và sử dụng kỹ thuật liên kết bản ghi để hợp nhất nhiều bộ dữ liệu. Việc làm sạch dữ liệu là một kỹ năng quan trọng đối với các nhà khoa học dữ liệu. Nếu quý vị muốn tìm hiểu thêm về việc làm sạch dữ liệu trong Python và các ứng dụng của nó, vui lòng tham khảo các chủ đề sau: Chuyên gia phân tích dữ liệu sử dụng Python và nhập liệu & làm sạch dữ liệu bằng Python.Điều kiện tiên quyết
Python ToolboxJoining Data with pandas1
Common data problems
In this chapter, you'll learn how to overcome some of the most common dirty data problems. You'll convert data types, apply range constraints to remove future data points, and remove duplicated data points to avoid double-counting.
2
Text and categorical data problems
Categorical and text data can often be some of the messiest parts of a dataset due to their unstructured nature. In this chapter, you’ll learn how to fix whitespace and capitalization inconsistencies in category labels, collapse multiple categories into one, and reformat strings for consistency.
3
Advanced data problems
In this chapter, you'll dive into more advanced data cleaning problems, such as ensuring that weights are all written in kilograms instead of pounds. You'll also gain invaluable skills that will help you verify that values have been added correctly, and that missing values don't negatively impact your analyses.
4
Record linkage
Record linkage is a powerful technique used to merge multiple datasets together, used when values have typos or different spellings. In this chapter, you'll learn how to link records by calculating the similarity between strings—you'll then use your new skills to join two restaurant review datasets into one clean master dataset.
Làm sạch dữ liệu với Python
Hoàn Thành
Nhận Giấy Chứng Nhận Hoàn Thành
Thêm chứng chỉ này vào hồ sơ LinkedIn, CV hoặc sơ yếu lý lịch của banChia sẻ trên mạng xã hội và trong đánh giá hiệu suất của ban
Bao gồm vớiCao cấp or Đội nhóm
Đăng Ký NgayTham gia cùng hơn 19 triệu học viên và bắt đầu Làm sạch dữ liệu với Python ngay hôm nay!
Tạo tài khoản miễn phí
hoặc
Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.