Khóa học
Nhập môn Quản lý Phiên bản Dữ liệu với DVC
Trung cấpTrình độ kỹ năng
Đã cập nhật tháng 06, 2025
DVCMachine Learning3 gio12 video35 Bài tập2,500 XP3,585Giấy chứng nhận Thành tích
Tạo Tài Khoản Miễn Phí
Tiếp tục với GoogleHiển thị thêm tùy chọnhoặc
Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.
Được người học tại hàng ngàn công ty yêu thích
Đào tạo một đội ngũ?
Dùng thử cho Doanh nghiệpMô tả khóa học
Điều kiện tiên quyết
Supervised Learning with scikit-learnIntroduction to Git1
Giới thiệu về DVC
Chương này cung cấp phần giới thiệu toàn diện về Data Version Control (DVC), một công cụ thiết yếu để phiên bản hóa dữ liệu trong Machine Learning. Bạn sẽ khám phá động lực đằng sau việc phiên bản hóa dữ liệu, hiểu sự khác biệt giữa phiên bản hóa dữ liệu và mã, và thử nghiệm với một bài toán phân loại đơn giản. Bạn sẽ ôn lại các lệnh Git cơ bản, tìm hiểu về DVC và thực hành thiết lập một kho lưu trữ. Chương kết thúc với tổng quan về các tính năng và trường hợp sử dụng của DVC, bao gồm phiên bản hóa dữ liệu và mô hình, CI/CD cho Machine Learning, theo dõi thí nghiệm, pipelines và hơn thế nữa.
2
Cấu hình DVC và Quản lý Dữ liệu
Chương này đi sâu vào thiết lập DVC, bao gồm cài đặt, khởi tạo kho lưu trữ và sử dụng tệp .dvcignore. Tiếp đó là khám phá cache và các tệp staging của DVC, giúp bạn biết cách thêm và xóa tệp, quản lý cache và hiểu cơ chế nền tảng dựa trên băm MD5. Chương cũng làm rõ về DVC remotes, phân biệt với Git remotes, và hướng dẫn cách thêm, liệt kê và chỉnh sửa chúng. Cuối cùng, bạn sẽ học cách tương tác với các remote này bằng cách đẩy (push) và kéo (pull) dữ liệu, checkout các phiên bản cụ thể, và fetch dữ liệu vào cache.
3
Pipelines trong DVC
Chương này tập trung vào tự động hóa các pipeline ML bằng DVC. Bạn sẽ tạo một tệp cấu hình chứa thiết lập và siêu tham số. Bạn cũng học cách trực quan hóa pipeline bằng đồ thị có hướng không chu trình và sử dụng các lệnh để mô tả phụ thuộc, lệnh thực thi và đầu ra. Phần chạy pipeline DVC được đề cập, bao gồm huấn luyện mô hình cục bộ và cách Git theo dõi siêu dữ liệu của DVC. Ngoài ra, bạn sẽ khám phá chức năng theo dõi metrics và plots trong DVC, bao gồm cách in metrics, tạo tệp plot, và so sánh metrics cùng plots giữa các giai đoạn của pipeline.
Nhập môn Quản lý Phiên bản Dữ liệu với DVC
Hoàn Thành
Nhận Giấy Chứng Nhận Hoàn Thành
Thêm chứng chỉ này vào hồ sơ LinkedIn, CV hoặc sơ yếu lý lịch của banChia sẻ trên mạng xã hội và trong đánh giá hiệu suất của banĐăng ký ngay
Tham gia cùng hơn 19 triệu học viên và bắt đầu Nhập môn Quản lý Phiên bản Dữ liệu với DVC ngay hôm nay!
Tạo Tài Khoản Miễn Phí
Tiếp tục với GoogleHiển thị thêm tùy chọnhoặc
Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.
Phát triển kỹ năng dữ liệu với DataCamp cho thiết bị di động
Tiến bộ mọi lúc mọi nơi với các khóa học cho thiết bị di động và thử thách lập trình 5 phút hằng ngày.