Khóa học
Làm sạch dữ liệu trong R
Trung cấpTrình độ kỹ năng
Đã cập nhật tháng 08, 2024
RData Preparation4 gio13 video44 Bài tập3,700 XP60,980Giấy chứng nhận Thành tích
Tạo Tài Khoản Miễn Phí
Tiếp tục với GoogleHiển thị thêm tùy chọnhoặc
Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.
Được người học tại hàng ngàn công ty yêu thích
Đào tạo một đội ngũ?
Dùng thử cho Doanh nghiệpMô tả khóa học
Điều kiện tiên quyết
Joining Data with dplyr1
Các vấn đề dữ liệu thường gặp
Trong chương này, bạn sẽ học cách vượt qua một số vấn đề dữ liệu bẩn phổ biến nhất. Bạn sẽ chuyển đổi kiểu dữ liệu, áp dụng các ràng buộc phạm vi để loại bỏ các điểm dữ liệu trong tương lai, và xóa các điểm dữ liệu trùng lặp để tránh đếm hai lần.
2
Dữ liệu phân loại và văn bản
Dữ liệu phân loại và văn bản thường là phần lộn xộn nhất của một tập dữ liệu do tính chất phi cấu trúc. Trong chương này, bạn sẽ học cách sửa khoảng trắng và không nhất quán về viết hoa trong nhãn danh mục, gộp nhiều danh mục thành một, và định dạng lại chuỗi để đảm bảo nhất quán.
3
Các vấn đề dữ liệu nâng cao
Trong chương này, bạn sẽ đi sâu vào các vấn đề làm sạch dữ liệu nâng cao hơn, chẳng hạn như đảm bảo tất cả khối lượng đều được ghi bằng kilogram thay vì pound. Bạn cũng sẽ trang bị những kỹ năng quý giá giúp bạn xác minh rằng các giá trị đã được nhập đúng và giá trị bị thiếu không làm ảnh hưởng tiêu cực đến phân tích.
4
Record Linkage
Record linkage là một kỹ thuật mạnh mẽ dùng để gộp nhiều tập dữ liệu lại với nhau khi các giá trị có lỗi chính tả hoặc cách viết khác nhau. Trong chương này, bạn sẽ học cách liên kết bản ghi bằng cách tính độ tương đồng giữa các chuỗi—sau đó bạn sẽ dùng kỹ năng mới để nối hai tập dữ liệu đánh giá nhà hàng thành một tập dữ liệu tổng sạch.
Làm sạch dữ liệu trong R
Hoàn Thành
Nhận Giấy Chứng Nhận Hoàn Thành
Thêm chứng chỉ này vào hồ sơ LinkedIn, CV hoặc sơ yếu lý lịch của banChia sẻ trên mạng xã hội và trong đánh giá hiệu suất của banĐăng ký ngay
Tham gia cùng hơn 19 triệu học viên và bắt đầu Làm sạch dữ liệu trong R ngay hôm nay!
Tạo Tài Khoản Miễn Phí
Tiếp tục với GoogleHiển thị thêm tùy chọnhoặc
Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.
Phát triển kỹ năng dữ liệu với DataCamp cho thiết bị di động
Tiến bộ mọi lúc mọi nơi với các khóa học cho thiết bị di động và thử thách lập trình 5 phút hằng ngày.