Kursus
Fundamental Big Data dengan PySpark
LanjutanTingkat Keterampilan
Diperbarui 02/2025
SparkData Engineering4 jam16 videos55 Latihan4,600 XP65,294Pernyataan Pencapaian
Buat Akun Gratis Anda
Lanjutkan dengan GoogleTampilkan opsi lainnyaatau
Dengan melanjutkan, Anda menerima Ketentuan Penggunaan kami, Kebijakan Privasi kami dan bahwa data Anda disimpan di Amerika Serikat.
Dipercaya oleh para pelajar di ribuan perusahaan
Melatih Tim?
Coba untuk BisnisDeskripsi Kursus
Persyaratan
Introduction to Python1
Pengantar analisis Big Data dengan Spark
Bab ini memperkenalkan dunia Big Data yang menarik, serta berbagai konsep dan beragam kerangka kerja untuk memproses Big Data. Anda akan memahami mengapa Apache Spark dianggap sebagai kerangka kerja terbaik untuk Big Data.
2
Pemrograman di PySpark RDD
Abstraksi utama yang disediakan Spark adalah resilient distributed dataset (RDD), yang merupakan tipe data fundamental dan tulang punggung dari mesin ini. Bab ini memperkenalkan RDD dan menunjukkan cara membuat serta mengeksekusi RDD menggunakan Transformations dan Actions pada RDD.
3
PySpark SQL & DataFrame
Pada bab ini, Anda akan mempelajari Spark SQL, yaitu modul Spark untuk pemrosesan data terstruktur. Modul ini menyediakan abstraksi pemrograman bernama DataFrame dan juga dapat bertindak sebagai mesin kueri SQL terdistribusi. Bab ini menunjukkan bagaimana Spark SQL memungkinkan Anda menggunakan DataFrame di Python.
4
Machine Learning dengan PySpark MLlib
PySpark MLlib adalah pustaka Machine Learning berskala besar milik Apache Spark dalam Python yang terdiri atas algoritme pembelajaran umum dan utilitasnya. Sepanjang bab terakhir ini, Anda akan mempelajari algoritme Machine Learning penting. Anda akan membangun mesin rekomendasi film dan penyaring spam, serta menggunakan pengelompokan k-means.
Fundamental Big Data dengan PySpark
Kursus Selesai
Memperoleh Surat Keterangan Prestasi
Tambahkan kredensial ini ke profil LinkedIn, resume, atau CV AndaBagikan di media sosial dan dalam penilaian kinerja AndaDaftar sekarang
Bergabung dengan 19 juta pelajar dan mulai Fundamental Big Data dengan PySpark Hari Ini!
Buat Akun Gratis Anda
Lanjutkan dengan GoogleTampilkan opsi lainnyaatau
Dengan melanjutkan, Anda menerima Ketentuan Penggunaan kami, Kebijakan Privasi kami dan bahwa data Anda disimpan di Amerika Serikat.
Kembangkan keterampilan data Anda dengan DataCamp untuk Mobile
Buat kemajuan di mana saja dengan kursus mobile kami dan tantangan coding harian 5 menit.