Chuyển đến nội dung chính
Trang chủPython

Khóa học

Giảm Chiều Dữ Liệu với Python

Trung cấpTrình độ kỹ năng
Đã cập nhật tháng 01, 2023
Hiểu rõ khái niệm giảm chiều trong dữ liệu của bạn và thành thạo các kỹ thuật để thực hiện điều đó trong Python.
Bắt Đầu Khóa Học Miễn Phí
PythonMachine Learning
4 gio
16 video
58 Bài tập
4,700 XP
36,437
Giấy chứng nhận Thành tích

Tạo Tài Khoản Miễn Phí

Tiếp tục với GoogleHiển thị thêm tùy chọn

hoặc


Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.

Được người học tại hàng ngàn công ty yêu thích

Group

Đào tạo một đội ngũ?

Dùng thử cho Doanh nghiệp

Mô tả khóa học

Các bộ dữ liệu có số chiều lớn có thể khiến bạn choáng ngợp và không biết bắt đầu từ đâu. Thông thường, bạn sẽ khám phá trực quan một bộ dữ liệu mới trước, nhưng khi có quá nhiều chiều, các cách tiếp cận cổ điển sẽ tỏ ra không đủ. May mắn là có những kỹ thuật trực quan hóa được thiết kế riêng cho dữ liệu nhiều chiều và bạn sẽ được giới thiệu trong khóa học này. Sau khi khám phá dữ liệu, bạn thường sẽ thấy nhiều đặc trưng gần như không chứa thông tin vì chúng không có độ biến thiên hoặc trùng lặp với đặc trưng khác. Bạn sẽ học cách phát hiện và loại bỏ các đặc trưng này khỏi bộ dữ liệu để tập trung vào những đặc trưng giàu thông tin. Ở bước tiếp theo, bạn có thể muốn xây dựng một mô hình dựa trên các đặc trưng này, và có thể hóa ra một số đặc trưng không ảnh hưởng gì đến biến bạn đang cố dự đoán. Bạn cũng sẽ học cách phát hiện và loại bỏ những đặc trưng không liên quan này để giảm số chiều và do đó giảm độ phức tạp. Cuối cùng, bạn sẽ học cách các kỹ thuật trích xuất đặc trưng có thể giúp giảm chiều cho bạn thông qua việc tính toán các thành phần chính không tương quan.

Điều kiện tiên quyết

Supervised Learning with scikit-learn
1

Khám phá Dữ liệu Nhiều Chiều

Bạn sẽ được giới thiệu khái niệm giảm chiều dữ liệu và học khi nào, tại sao điều này lại quan trọng. Bạn sẽ học sự khác biệt giữa chọn đặc trưng và trích xuất đặc trưng, và sẽ áp dụng cả hai kỹ thuật cho việc khám phá dữ liệu. Chương kết thúc với bài học về t-SNE, một kỹ thuật trích xuất đặc trưng mạnh mẽ cho phép bạn trực quan hóa một bộ dữ liệu có số chiều lớn.
Bắt Đầu Chương
2

Chọn Đặc Trưng I - Lựa chọn theo Thông tin Đặc trưng

Trong chương đầu tiên trong hai chương về chọn đặc trưng, bạn sẽ tìm hiểu về “lời nguyền chiều dữ liệu” và cách giảm chiều giúp bạn vượt qua vấn đề này. Bạn sẽ được giới thiệu nhiều kỹ thuật để phát hiện và loại bỏ các đặc trưng mang lại ít giá trị gia tăng cho bộ dữ liệu, hoặc vì chúng có độ biến thiên thấp, quá nhiều giá trị khuyết, hoặc tương quan mạnh với các đặc trưng khác.
Bắt Đầu Chương
Giảm Chiều Dữ Liệu với Python
Hoàn
Thành

Nhận Giấy Chứng Nhận Hoàn Thành

Thêm chứng chỉ này vào hồ sơ LinkedIn, CV hoặc sơ yếu lý lịch của ban
Chia sẻ trên mạng xã hội và trong đánh giá hiệu suất của ban
Đăng ký ngay

Tham gia cùng hơn 19 triệu học viên và bắt đầu Giảm Chiều Dữ Liệu với Python ngay hôm nay!

Tạo Tài Khoản Miễn Phí

Tiếp tục với GoogleHiển thị thêm tùy chọn

hoặc


Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.

Phát triển kỹ năng dữ liệu với DataCamp cho thiết bị di động

Tiến bộ mọi lúc mọi nơi với các khóa học cho thiết bị di động và thử thách lập trình 5 phút hằng ngày.