Transformasi Data dengan Spark SQL di Databricks

MenengahTingkat Keterampilan

Diperbarui 07/2026

Bangun pipeline data end-to-end - dari pembersihan dan agregasi hingga streaming dan orkestrasi.

Deskripsi Kursus

Siap menangani data dunia nyata dalam skala besar? Kursus ini mengajarkan Anda mentransformasi himpunan data besar menggunakan Spark SQL dan PySpark di Databricks. Pelajari cara membentuk dan membersihkan data, menjalankan agregasi dengan join yang dioptimalkan, serta menerapkan window function untuk analitik lanjut. Anda juga akan menyiapkan streaming berbasis file dengan checkpoint tahan gangguan dan menyimpan hasil sebagai tabel Delta. Pada akhir kursus, Anda akan mengorkestrasi pipeline produksi multi-langkah dengan Databricks Workflows dan Lakeflow Declarative Pipelines.

Persyaratan

Introduction to Databricks SQL Introduction to PySpark

Memuat dan Membentuk Data

Dalam bab ini, Anda akan belajar bekerja dengan notebook Databricks, memuat data CSV ke dalam Spark DataFrame, dan membentuk data menggunakan PySpark dan SQL.

Deskripsi Kursus

Memperoleh Surat Keterangan Prestasi

Bergabung dengan .css-nklxlk{color:var(--wf-brand--main, #03EF62);}19 juta pelajar dan mulai Transformasi Data dengan Spark SQL di Databricks Hari Ini!

Buat Akun Gratis Anda

Kembangkan keterampilan data Anda dengan DataCamp untuk Mobile

Bergabung dengan 19 juta pelajar dan mulai Transformasi Data dengan Spark SQL di Databricks Hari Ini!