Lewati ke konten utama

Kursus

Machine Learning dengan Model Berbasis Pohon di Python

MenengahTingkat Keterampilan

Diperbarui 12/2025

Dalam kursus ini, Anda akan belajar cara menggunakan model berbasis pohon dan ensemble untuk regresi dan klasifikasi menggunakan scikit-learn.

Mulai Kursus Gratis

PythonMachine Learning

5 jam

15 videos

57 Latihan

4,650 XP

110K+

Pernyataan Pencapaian

Dipercaya oleh para pelajar di ribuan perusahaan

Melatih Tim?

Coba untuk Bisnis

Deskripsi Kursus

Decision tree adalah model pembelajaran terawasi yang digunakan untuk permasalahan klasifikasi dan regresi. Model pohon sangat fleksibel, namun hal ini memiliki konsekuensi: di satu sisi, pohon mampu menangkap hubungan nonlinier yang kompleks; di sisi lain, pohon cenderung menghafal derau yang ada dalam himpunan data. Dengan menggabungkan prediksi dari pohon yang dilatih secara berbeda, metode ensemble memanfaatkan fleksibilitas pohon sekaligus mengurangi kecenderungan untuk menghafal derau. Metode ensemble digunakan di berbagai bidang dan telah terbukti sering memenangkan banyak kompetisi Machine Learning. Dalam kursus ini, Anda akan mempelajari cara menggunakan Python untuk melatih decision tree dan model berbasis pohon dengan pustaka Machine Learning scikit-learn yang mudah digunakan. Anda akan memahami kelebihan dan kekurangan model pohon serta melihat bagaimana ensembling dapat mengatasi kekurangan tersebut, sambil berlatih menggunakan himpunan data dunia nyata. Terakhir, Anda juga akan memahami cara melakukan penyetelan pada hiperparameter yang paling berpengaruh agar memperoleh performa optimal dari model Anda.

Persyaratan

Supervised Learning with scikit-learn

1

Classification and Regression Trees

Classification and Regression Trees (CART) adalah sekumpulan model pembelajaran terawasi yang digunakan untuk permasalahan klasifikasi dan regresi. Pada bab ini, Anda akan diperkenalkan pada algoritma CART.

Pohon keputusan untuk klasifikasi

Latih pohon klasifikasi pertama Anda

Evaluasi pohon klasifikasi

Logistic regression vs classification tree

Pembelajaran pohon klasifikasi

Membangun pohon klasifikasi

Menggunakan entropy sebagai kriteria

Entropi vs Indeks Gini

Pohon keputusan untuk regresi

Latih pohon regresi pertama Anda

Evaluasi pohon regresi

Regresi linear vs pohon regresi

2

Trade-off Bias-Variance

Trade-off bias-variance adalah salah satu konsep mendasar dalam Machine Learning terawasi. Pada bab ini, Anda akan memahami cara mendiagnosis masalah overfitting dan underfitting. Anda juga akan diperkenalkan pada konsep ensembling, yaitu ketika prediksi dari beberapa model digabungkan untuk menghasilkan prediksi yang lebih tangguh.

Galat Generalisasi

Kompleksitas, bias, dan varians

Overfitting dan underfitting

Mendiagnosis masalah bias dan varians

Inisialisasi model

Evaluasi galat CV 10-fold

Evaluasi galat pelatihan

Bias tinggi atau varians tinggi?

Ensemble Learning

Mendefinisikan ensemble

Evaluasi pengklasifikasi individual

Kinerja lebih baik dengan Voting Classifier

3

Bagging dan Random Forest

Bagging adalah metode ensemble yang melibatkan pelatihan algoritma yang sama berkali-kali menggunakan subset berbeda yang diambil dari data pelatihan. Pada bab ini, Anda akan memahami bagaimana bagging dapat digunakan untuk membangun ensemble pohon. Anda juga akan mempelajari bagaimana algoritma random forests dapat meningkatkan keragaman ensemble melalui pengacakan pada tingkat setiap pemisahan di dalam pohon-pohon yang membentuk ensemble.

Definisikan bagging classifier

Evaluasi kinerja Bagging

Evaluasi Out-of-Bag

Persiapkan landasan

Skor OOB vs Skor Test Set

Random Forests (RF)

Latih sebuah regresor RF

Evaluasi RF regressor

Memvisualisasikan pentingnya fitur

4

Boosting

Boosting mengacu pada metode ensemble di mana beberapa model dilatih secara berurutan dan setiap model belajar dari kesalahan pendahulunya. Pada bab ini, Anda akan diperkenalkan pada dua metode boosting: AdaBoost dan Gradient Boosting.

Definisikan classifier AdaBoost

Latih pengklasifikasi AdaBoost

Evaluasi pengklasifikasi AdaBoost

Gradient Boosting (GB)

Definisikan regressor GB

Latih regressor GB

Evaluasi GB regressor

Stochastic Gradient Boosting (SGB)

Regresi dengan SGB

Latih regressor SGB

Evaluasi SGB regressor

5

Penyetelan Model

Hiperparameter pada sebuah model Machine Learning adalah parameter yang tidak dipelajari dari data. Parameter ini harus ditetapkan sebelum menyesuaikan model ke himpunan pelatihan. Pada bab ini, Anda akan mempelajari cara menyetel hiperparameter model berbasis pohon menggunakan grid search cross validation.

Menyetel Hyperparameter CART

Hiperparameter pohon

Atur grid hyperparameter untuk tree

Cari pohon yang optimal

Evaluasi pohon optimal

Menyetel Hyperparameter RF

Hyperparameter random forests

Tetapkan grid hyperparameter untuk RF

Cari hutan yang optimal

Evaluasi hutan optimal

Machine Learning dengan Model Berbasis Pohon di Python

Kursus
Selesai

Memperoleh Surat Keterangan Prestasi

Tambahkan kredensial ini ke profil LinkedIn, resume, atau CV Anda
Bagikan di media sosial dan dalam penilaian kinerja AndaDaftar sekarang

Bergabung dengan 19 juta pelajar dan mulai Machine Learning dengan Model Berbasis Pohon di Python Hari Ini!

Kembangkan keterampilan data Anda dengan DataCamp untuk Mobile

Buat kemajuan di mana saja dengan kursus mobile kami dan tantangan coding harian 5 menit.