Chuyển đến nội dung chính
Trang chủMachine Learning

Khóa học

Nhập môn Quản lý Phiên bản Dữ liệu với DVC

Trung cấpTrình độ kỹ năng
Đã cập nhật tháng 06, 2025
Bắt Đầu Khóa Học Miễn Phí
DVCMachine Learning
3 gio
12 video
35 Bài tập
2,500 XP
3,585
Giấy chứng nhận Thành tích

Tạo Tài Khoản Miễn Phí

Tiếp tục với GoogleHiển thị thêm tùy chọn

hoặc


Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.

Được người học tại hàng ngàn công ty yêu thích

Group

Đào tạo một đội ngũ?

Dùng thử cho Doanh nghiệp

Mô tả khóa học

Tìm hiểu sâu về Data Version Control (DVC) — công cụ quản lý và phiên bản hóa dữ liệu cho Machine Learning. Khám phá vai trò của DVC trong vòng đời ML, phân biệt phiên bản hóa dữ liệu với phiên bản hóa mã, và xem xét các tính năng cùng trường hợp sử dụng của DVC. Học cách thiết lập DVC, bao gồm quản lý bộ nhớ đệm (cache) và remotes, cũng như ứng dụng trong CI/CD, theo dõi thí nghiệm và pipelines. Tự động hóa các pipeline ML với trọng tâm là mô-đun hóa mã, và thực hành chạy pipeline hiệu quả. Kết thúc với đánh giá mô hình, khám phá cách theo dõi chỉ số trong DVC để hỗ trợ ra quyết định.

Điều kiện tiên quyết

Supervised Learning with scikit-learnIntroduction to Git
1

Giới thiệu về DVC

Chương này cung cấp phần giới thiệu toàn diện về Data Version Control (DVC), một công cụ thiết yếu để phiên bản hóa dữ liệu trong Machine Learning. Bạn sẽ khám phá động lực đằng sau việc phiên bản hóa dữ liệu, hiểu sự khác biệt giữa phiên bản hóa dữ liệu và mã, và thử nghiệm với một bài toán phân loại đơn giản. Bạn sẽ ôn lại các lệnh Git cơ bản, tìm hiểu về DVC và thực hành thiết lập một kho lưu trữ. Chương kết thúc với tổng quan về các tính năng và trường hợp sử dụng của DVC, bao gồm phiên bản hóa dữ liệu và mô hình, CI/CD cho Machine Learning, theo dõi thí nghiệm, pipelines và hơn thế nữa.
Bắt Đầu Chương
2

Cấu hình DVC và Quản lý Dữ liệu

Chương này đi sâu vào thiết lập DVC, bao gồm cài đặt, khởi tạo kho lưu trữ và sử dụng tệp .dvcignore. Tiếp đó là khám phá cache và các tệp staging của DVC, giúp bạn biết cách thêm và xóa tệp, quản lý cache và hiểu cơ chế nền tảng dựa trên băm MD5. Chương cũng làm rõ về DVC remotes, phân biệt với Git remotes, và hướng dẫn cách thêm, liệt kê và chỉnh sửa chúng. Cuối cùng, bạn sẽ học cách tương tác với các remote này bằng cách đẩy (push) và kéo (pull) dữ liệu, checkout các phiên bản cụ thể, và fetch dữ liệu vào cache.
Bắt Đầu Chương
3

Pipelines trong DVC

Chương này tập trung vào tự động hóa các pipeline ML bằng DVC. Bạn sẽ tạo một tệp cấu hình chứa thiết lập và siêu tham số. Bạn cũng học cách trực quan hóa pipeline bằng đồ thị có hướng không chu trình và sử dụng các lệnh để mô tả phụ thuộc, lệnh thực thi và đầu ra. Phần chạy pipeline DVC được đề cập, bao gồm huấn luyện mô hình cục bộ và cách Git theo dõi siêu dữ liệu của DVC. Ngoài ra, bạn sẽ khám phá chức năng theo dõi metrics và plots trong DVC, bao gồm cách in metrics, tạo tệp plot, và so sánh metrics cùng plots giữa các giai đoạn của pipeline.
Bắt Đầu Chương
Nhập môn Quản lý Phiên bản Dữ liệu với DVC
Hoàn
Thành

Nhận Giấy Chứng Nhận Hoàn Thành

Thêm chứng chỉ này vào hồ sơ LinkedIn, CV hoặc sơ yếu lý lịch của ban
Chia sẻ trên mạng xã hội và trong đánh giá hiệu suất của ban
Đăng ký ngay

Tham gia cùng hơn 19 triệu học viên và bắt đầu Nhập môn Quản lý Phiên bản Dữ liệu với DVC ngay hôm nay!

Tạo Tài Khoản Miễn Phí

Tiếp tục với GoogleHiển thị thêm tùy chọn

hoặc


Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.

Phát triển kỹ năng dữ liệu với DataCamp cho thiết bị di động

Tiến bộ mọi lúc mọi nơi với các khóa học cho thiết bị di động và thử thách lập trình 5 phút hằng ngày.