Lewati ke konten utama
BerandaSpark

Kursus

Rekayasa Fitur dengan PySpark

LanjutanTingkat Keterampilan
Diperbarui 01/2026
Pelajari detail-detail teknis yang memakan 70-80% waktu para ilmuwan data; pengolahan data dan rekayasa fitur.
Mulai Kursus Gratis
SparkData Manipulation
4 jam
16 videos
60 Latihan
5,000 XP
17,778
Pernyataan Pencapaian

Buat Akun Gratis Anda

Lanjutkan dengan GoogleTampilkan opsi lainnya

atau


Dengan melanjutkan, Anda menerima Ketentuan Penggunaan kami, Kebijakan Privasi kami dan bahwa data Anda disimpan di Amerika Serikat.

Dipercaya oleh para pelajar di ribuan perusahaan

Group

Melatih Tim?

Coba untuk Bisnis

Deskripsi Kursus

Dunia nyata itu berantakan dan tugas Anda adalah membuatnya masuk akal. Himpunan data mainan seperti MTCars dan Iris adalah hasil kurasi dan pembersihan yang cermat; sekalipun demikian, data tetap perlu ditransformasi agar algoritme machine learning yang andal dapat mengekstrak makna, melakukan peramalan, klasifikasi, atau pengelompokan. Kursus ini membahas detail riil yang menghabiskan 70–80% waktu data scientist: penataan data dan rekayasa fitur. Karena ukuran himpunan data kini semakin besar, mari gunakan PySpark untuk memangkas masalah Big Data menjadi lebih terkendali!

Persyaratan

Supervised Learning with scikit-learnIntroduction to PySpark
1

Analisis Data Eksploratori

Pahami terlebih dahulu permasalahan Anda sebelum mulai! Lalu pelajari cara memeriksa himpunan data Anda secara statistik dan visual!
Mulai Bab
2

Penataan dengan Fungsi Spark

Data nyata jarang bersih dan siap dianalisis. Di bab ini, pelajari cara menghapus informasi yang tidak diperlukan, menangani nilai yang hilang, dan menambahkan data tambahan ke analisis Anda.
Mulai Bab
3

Rekayasa Fitur

Di bab ini, pelajari cara membuat fitur baru agar model machine learning Anda dapat belajar darinya. Kita akan melihat cara menghasilkannya dengan mengombinasikan kolom, mengekstraksi nilai dari kolom yang berantakan, atau melakukan pengodean untuk hasil yang lebih baik.
Mulai Bab
Rekayasa Fitur dengan PySpark
Kursus
Selesai

Memperoleh Surat Keterangan Prestasi

Tambahkan kredensial ini ke profil LinkedIn, resume, atau CV Anda
Bagikan di media sosial dan dalam penilaian kinerja Anda
Daftar sekarang

Bergabung dengan 19 juta pelajar dan mulai Rekayasa Fitur dengan PySpark Hari Ini!

Buat Akun Gratis Anda

Lanjutkan dengan GoogleTampilkan opsi lainnya

atau


Dengan melanjutkan, Anda menerima Ketentuan Penggunaan kami, Kebijakan Privasi kami dan bahwa data Anda disimpan di Amerika Serikat.

Kembangkan keterampilan data Anda dengan DataCamp untuk Mobile

Buat kemajuan di mana saja dengan kursus mobile kami dan tantangan coding harian 5 menit.