Kursus
Pengantar PySpark
MenengahTingkat Keterampilan
Diperbarui 01/2026
SparkData Engineering4 jam11 videos36 Latihan2,850 XP29,496Pernyataan Pencapaian
Buat Akun Gratis Anda
Lanjutkan dengan GoogleTampilkan opsi lainnyaatau
Dengan melanjutkan, Anda menerima Ketentuan Penggunaan kami, Kebijakan Privasi kami dan bahwa data Anda disimpan di Amerika Serikat.
Dipercaya oleh para pelajar di ribuan perusahaan
Melatih Tim?
Coba untuk BisnisDeskripsi Kursus
Mengapa Spark? Mengapa Sekarang?
Temukan kecepatan dan skalabilitas Apache Spark, kerangka kerja yang kuat yang dirancang untuk mengelola data besar. Melalui pelajaran interaktif dan latihan praktis, Anda akan melihat bagaimana pemrosesan in-memory Spark memberikan keunggulan dibandingkan kerangka kerja tradisional seperti Hadoop. Anda akan memulai dengan menyiapkan sesi Spark dan mempelajari komponen inti seperti Resilient Distributed Datasets (RDDs) dan DataFrames. Pelajari cara menyaring, mengelompokkan, dan menggabungkan dataset dengan mudah sambil bekerja pada contoh-contoh dunia nyata.Tingkatkan Keterampilan Python dan SQL Anda untuk Big Data
Pelajari cara memanfaatkan PySpark SQL untuk melakukan kueri dan mengelola data menggunakan sintaks SQL yang familiar. Mengatasi skema data, tipe data kompleks, dan fungsi yang didefinisikan pengguna (UDF), sambil mengembangkan keterampilan dalam caching dan mengoptimalkan kinerja untuk sistem terdistribusi.Bangun Fondasi Big Data Anda
Pada akhir kursus ini, Anda akan memiliki kepercayaan diri untuk mengelola, menganalisis, dan memproses data besar menggunakan PySpark. Dengan keterampilan dasar ini, Anda akan siap untuk menjelajahi topik-topik lanjutan seperti machine learning dan analisis big data.Persyaratan
Introduction to SQLData Manipulation with pandas1
Pengantar Apache Spark dan PySpark
Pengantar umum tentang PySpark dan komputasi terdistribusi. Bagian ini memperkenalkan PySpark, PySpark DataFrame, dan RDD.
2
PySpark di Python
Kelanjutan DataFrame dan tipe data kompleks. Bagian ini memperluas fitur yang ditawarkan DataFrame di PySpark dan memperkenalkan beberapa konsep Spark SQL.
3
Pengantar PySpark SQL
Mendalami pemanfaatan Spark SQL dan PySpark untuk pemrosesan data yang dapat diskalakan, menggabungkan kesederhanaan SQL dengan kekuatan komputasi terdistribusi PySpark untuk menangani himpunan data besar secara efisien.
Pengantar PySpark
Kursus Selesai
Memperoleh Surat Keterangan Prestasi
Tambahkan kredensial ini ke profil LinkedIn, resume, atau CV AndaBagikan di media sosial dan dalam penilaian kinerja AndaDaftar sekarang
Bergabung dengan 19 juta pelajar dan mulai Pengantar PySpark Hari Ini!
Buat Akun Gratis Anda
Lanjutkan dengan GoogleTampilkan opsi lainnyaatau
Dengan melanjutkan, Anda menerima Ketentuan Penggunaan kami, Kebijakan Privasi kami dan bahwa data Anda disimpan di Amerika Serikat.
Kembangkan keterampilan data Anda dengan DataCamp untuk Mobile
Buat kemajuan di mana saja dengan kursus mobile kami dan tantangan coding harian 5 menit.