Kursus
Pengantar Versioning Data dengan DVC
MenengahTingkat Keterampilan
Diperbarui 06/2025
DVCMachine Learning3 jam12 videos35 Latihan2,500 XP3,585Pernyataan Pencapaian
Buat Akun Gratis Anda
Lanjutkan dengan GoogleTampilkan opsi lainnyaatau
Dengan melanjutkan, Anda menerima Ketentuan Penggunaan kami, Kebijakan Privasi kami dan bahwa data Anda disimpan di Amerika Serikat.
Dipercaya oleh para pelajar di ribuan perusahaan
Melatih Tim?
Coba untuk BisnisDeskripsi Kursus
Menjelajahi fitur DVC
Anda akan memahami motivasi di balik versi data, siklus hidup pembelajaran mesin, serta fitur unik dan kasus penggunaan DVC. Anda juga akan mempelajari tentang pengaturan DVC, termasuk instalasi, inisialisasi repositori, dan berkas .dvcignore. Anda akan menjelajahi file cache dan staging DVC, belajar cara menambahkan dan menghapus file, mengelola cache, serta memahami mekanisme dasarnya. Anda akan mempelajari tentang remote DVC, menjelaskan perbedaan antara remote DVC dan Git, menambahkan remote, menampilkan daftar remote, dan memodifikasi remote. Anda akan belajar berinteraksi dengan remote, mengirim dan menerima data, memeriksa versi tertentu, dan mengambil data ke cache.Otomatisasi dan evaluasi
Anda akan termotivasi untuk mengotomatisasi alur kerja ML, dengan menekankan pada modularisasi kode dan pembuatan berkas konfigurasi. Anda akan diperkenalkan pada DVC pipelines sebagai grafik acyclic terarah, dengan pengalaman praktis dalam menambahkan tahap-tahap dan masukan serta keluaran mereka. Anda akan berlatih mengimplementasikan pipeline-pipeline ini secara efisien untuk mendukung berbagai kasus penggunaan dalam pelatihan model machine learning. Kursus ini diakhiri dengan fokus pada evaluasi, menampilkan cara metrik dan grafik dilacak di DVC.Persyaratan
Supervised Learning with scikit-learnIntroduction to Git1
Pengantar DVC
Bab ini memberikan pengantar komprehensif tentang Data Version Control (DVC), alat penting untuk versioning data dalam machine learning. Anda akan mengeksplorasi motivasi di balik versioning data, memahami perbedaannya dengan versioning kode, dan mencoba masalah klasifikasi sederhana. Anda akan meninjau perintah Git dasar, mempelajari DVC, dan berlatih menyiapkan repositori. Bab ini diakhiri dengan ikhtisar fitur dan kasus penggunaan DVC, termasuk versioning data dan model, CI/CD untuk machine learning, pelacakan eksperimen, pipeline, dan lainnya.
2
Konfigurasi DVC dan Manajemen Data
Bab ini membahas penyiapan DVC, mencakup aspek seperti instalasi, inisialisasi repositori, dan penggunaan berkas .dvcignore. Bab ini juga mengulas eksplorasi cache DVC dan berkas staging, memberikan pemahaman tentang cara menambahkan dan menghapus berkas, mengelola cache, serta memahami mekanisme dasarnya menggunakan hash MD5. Bab ini juga menjelaskan DVC remote, membedakannya dari Git remote, dan memandu Anda cara menambah, menampilkan daftar, dan memodifikasinya. Terakhir, Anda akan mempelajari cara berinteraksi dengan remote tersebut dengan melakukan push dan pull data, checkout versi tertentu, serta fetch data ke cache.
3
Pipeline di DVC
Bab ini berfokus pada otomasi pipeline ML menggunakan DVC. Anda akan membuat berkas konfigurasi yang berisi pengaturan dan hiperparameter. Anda juga mempelajari visualisasi pipeline menggunakan directed acyclic graph dan menggunakan perintah untuk mendeskripsikan dependensi, perintah, dan keluaran. Eksekusi pipeline DVC dibahas, termasuk pelatihan model lokal dan bagaimana Git melacak metadata DVC. Selain itu, Anda akan mengeksplorasi pelacakan metrik dan plot di DVC, termasuk cara menampilkan metrik, membuat berkas plot, serta membandingkan metrik dan plot di berbagai tahap pipeline.
Pengantar Versioning Data dengan DVC
Kursus Selesai
Memperoleh Surat Keterangan Prestasi
Tambahkan kredensial ini ke profil LinkedIn, resume, atau CV AndaBagikan di media sosial dan dalam penilaian kinerja AndaDaftar sekarang
Bergabung dengan 19 juta pelajar dan mulai Pengantar Versioning Data dengan DVC Hari Ini!
Buat Akun Gratis Anda
Lanjutkan dengan GoogleTampilkan opsi lainnyaatau
Dengan melanjutkan, Anda menerima Ketentuan Penggunaan kami, Kebijakan Privasi kami dan bahwa data Anda disimpan di Amerika Serikat.
Kembangkan keterampilan data Anda dengan DataCamp untuk Mobile
Buat kemajuan di mana saja dengan kursus mobile kami dan tantangan coding harian 5 menit.