Lewati ke konten utama
BerandaMachine Learning

Kursus

Pengantar Versioning Data dengan DVC

MenengahTingkat Keterampilan
Diperbarui 06/2025
Jelajahi Pengendalian Versi Data untuk Pengelolaan Data ML. Atur pengaturan utama, otomatisasi alur kerja, dan evaluasi model dengan lancar.
Mulai Kursus Gratis
DVCMachine Learning
3 jam
12 videos
35 Latihan
2,500 XP
3,585
Pernyataan Pencapaian

Buat Akun Gratis Anda

Lanjutkan dengan GoogleTampilkan opsi lainnya

atau


Dengan melanjutkan, Anda menerima Ketentuan Penggunaan kami, Kebijakan Privasi kami dan bahwa data Anda disimpan di Amerika Serikat.

Dipercaya oleh para pelajar di ribuan perusahaan

Group

Melatih Tim?

Coba untuk Bisnis

Deskripsi Kursus

Kursus ini memberikan pengenalan komprehensif tentang Data Version Control (DVC), sebuah alat yang dirancang untuk pengelolaan dan penomoran versi data machine learning secara efisien. Anda akan memahami siklus hidup produk machine learning, membedakan versi data dari versi kode, dan menjelajahi fitur-fitur DVC serta kasus penggunaannya.

Menjelajahi fitur DVC

Anda akan memahami motivasi di balik versi data, siklus hidup pembelajaran mesin, serta fitur unik dan kasus penggunaan DVC. Anda juga akan mempelajari tentang pengaturan DVC, termasuk instalasi, inisialisasi repositori, dan berkas .dvcignore. Anda akan menjelajahi file cache dan staging DVC, belajar cara menambahkan dan menghapus file, mengelola cache, serta memahami mekanisme dasarnya. Anda akan mempelajari tentang remote DVC, menjelaskan perbedaan antara remote DVC dan Git, menambahkan remote, menampilkan daftar remote, dan memodifikasi remote. Anda akan belajar berinteraksi dengan remote, mengirim dan menerima data, memeriksa versi tertentu, dan mengambil data ke cache.

Otomatisasi dan evaluasi

Anda akan termotivasi untuk mengotomatisasi alur kerja ML, dengan menekankan pada modularisasi kode dan pembuatan berkas konfigurasi. Anda akan diperkenalkan pada DVC pipelines sebagai grafik acyclic terarah, dengan pengalaman praktis dalam menambahkan tahap-tahap dan masukan serta keluaran mereka. Anda akan berlatih mengimplementasikan pipeline-pipeline ini secara efisien untuk mendukung berbagai kasus penggunaan dalam pelatihan model machine learning. Kursus ini diakhiri dengan fokus pada evaluasi, menampilkan cara metrik dan grafik dilacak di DVC.

Persyaratan

Supervised Learning with scikit-learnIntroduction to Git
1

Pengantar DVC

Bab ini memberikan pengantar komprehensif tentang Data Version Control (DVC), alat penting untuk versioning data dalam machine learning. Anda akan mengeksplorasi motivasi di balik versioning data, memahami perbedaannya dengan versioning kode, dan mencoba masalah klasifikasi sederhana. Anda akan meninjau perintah Git dasar, mempelajari DVC, dan berlatih menyiapkan repositori. Bab ini diakhiri dengan ikhtisar fitur dan kasus penggunaan DVC, termasuk versioning data dan model, CI/CD untuk machine learning, pelacakan eksperimen, pipeline, dan lainnya.
Mulai Bab
2

Konfigurasi DVC dan Manajemen Data

Bab ini membahas penyiapan DVC, mencakup aspek seperti instalasi, inisialisasi repositori, dan penggunaan berkas .dvcignore. Bab ini juga mengulas eksplorasi cache DVC dan berkas staging, memberikan pemahaman tentang cara menambahkan dan menghapus berkas, mengelola cache, serta memahami mekanisme dasarnya menggunakan hash MD5. Bab ini juga menjelaskan DVC remote, membedakannya dari Git remote, dan memandu Anda cara menambah, menampilkan daftar, dan memodifikasinya. Terakhir, Anda akan mempelajari cara berinteraksi dengan remote tersebut dengan melakukan push dan pull data, checkout versi tertentu, serta fetch data ke cache.
Mulai Bab
3

Pipeline di DVC

Bab ini berfokus pada otomasi pipeline ML menggunakan DVC. Anda akan membuat berkas konfigurasi yang berisi pengaturan dan hiperparameter. Anda juga mempelajari visualisasi pipeline menggunakan directed acyclic graph dan menggunakan perintah untuk mendeskripsikan dependensi, perintah, dan keluaran. Eksekusi pipeline DVC dibahas, termasuk pelatihan model lokal dan bagaimana Git melacak metadata DVC. Selain itu, Anda akan mengeksplorasi pelacakan metrik dan plot di DVC, termasuk cara menampilkan metrik, membuat berkas plot, serta membandingkan metrik dan plot di berbagai tahap pipeline.
Mulai Bab
Pengantar Versioning Data dengan DVC
Kursus
Selesai

Memperoleh Surat Keterangan Prestasi

Tambahkan kredensial ini ke profil LinkedIn, resume, atau CV Anda
Bagikan di media sosial dan dalam penilaian kinerja Anda
Daftar sekarang

Bergabung dengan 19 juta pelajar dan mulai Pengantar Versioning Data dengan DVC Hari Ini!

Buat Akun Gratis Anda

Lanjutkan dengan GoogleTampilkan opsi lainnya

atau


Dengan melanjutkan, Anda menerima Ketentuan Penggunaan kami, Kebijakan Privasi kami dan bahwa data Anda disimpan di Amerika Serikat.

Kembangkan keterampilan data Anda dengan DataCamp untuk Mobile

Buat kemajuan di mana saja dengan kursus mobile kami dan tantangan coding harian 5 menit.