Lewati ke konten utama
BerandaSpark

Kursus

Dasar-Dasar PySpark

MenengahTingkat Keterampilan
Diperbarui 03/2025
Pelajari cara mengimplementasikan manajemen data terdistribusi dan machine learning di Spark menggunakan paket PySpark.
Mulai Kursus Gratis
SparkData Engineering
4 jam
45 Latihan
3,850 XP
150K+
Pernyataan Pencapaian

Buat Akun Gratis Anda

Lanjutkan dengan GoogleTampilkan opsi lainnya

atau


Dengan melanjutkan, Anda menerima Ketentuan Penggunaan kami, Kebijakan Privasi kami dan bahwa data Anda disimpan di Amerika Serikat.

Dipercaya oleh para pelajar di ribuan perusahaan

Group

Melatih Tim?

Coba untuk Bisnis

Deskripsi Kursus

Dalam kursus ini, Anda akan mempelajari cara menggunakan Spark dari Python! Spark adalah alat untuk melakukan komputasi paralel dengan himpunan data berukuran besar dan terintegrasi dengan baik dengan Python. PySpark adalah paket Python yang mewujudkannya. Anda akan menggunakan paket ini untuk bekerja dengan data penerbangan dari Portland dan Seattle. Anda akan mempelajari cara mengolah data ini dan membangun keseluruhan pipeline Machine Learning untuk memprediksi apakah penerbangan akan tertunda atau tidak. Bersiaplah untuk menambahkan Spark ke kode Python Anda dan menyelami dunia Machine Learning berkinerja tinggi!

Persyaratan

Introduction to Python
1

Mengenal PySpark

Di bab ini, Anda akan mempelajari bagaimana Spark mengelola data serta bagaimana Anda dapat membaca dan menulis tabel dari Python.
Mulai Bab
2

Memanipulasi data

Di bab ini, Anda akan mempelajari modul pyspark.sql, yang menyediakan kueri data teroptimasi untuk sesi Spark Anda.
Mulai Bab
3

Memulai dengan pipeline Machine Learning

4

Penyetelan dan pemilihan model

Di bab terakhir ini, Anda akan menerapkan yang telah dipelajari untuk membuat model yang memprediksi penerbangan mana yang akan tertunda.
Mulai Bab
Dasar-Dasar PySpark
Kursus
Selesai

Memperoleh Surat Keterangan Prestasi

Tambahkan kredensial ini ke profil LinkedIn, resume, atau CV Anda
Bagikan di media sosial dan dalam penilaian kinerja Anda
Daftar sekarang

Bergabung dengan 19 juta pelajar dan mulai Dasar-Dasar PySpark Hari Ini!

Buat Akun Gratis Anda

Lanjutkan dengan GoogleTampilkan opsi lainnya

atau


Dengan melanjutkan, Anda menerima Ketentuan Penggunaan kami, Kebijakan Privasi kami dan bahwa data Anda disimpan di Amerika Serikat.

Kembangkan keterampilan data Anda dengan DataCamp untuk Mobile

Buat kemajuan di mana saja dengan kursus mobile kami dan tantangan coding harian 5 menit.