Courses
Big Data Fundamentals with PySpark
ขั้นสูงระดับทักษะ
อัปเดตแล้ว 02/2568SparkData Engineering4 ชม.16 videos55 Exercises4,600 เอ็กซ์พี64,506คำแถลงแสดงความสำเร็จ
เป็นที่ชื่นชอบของผู้เรียนในบริษัทหลายพันแห่ง
ฝึกอบรมบุคคลตั้งแต่ 2 คนขึ้นไป?
ลองใช้ DataCamp for Businessคำอธิบายรายวิชา
ข้อกำหนดเบื้องต้น
Introduction to Python1
Introduction to Big Data analysis with Spark
This chapter introduces the exciting world of Big Data, as well as the various concepts and different frameworks for processing Big Data. You will understand why Apache Spark is considered the best framework for BigData.
2
Programming in PySpark RDD’s
The main abstraction Spark provides is a resilient distributed dataset (RDD), which is the fundamental and backbone data type of this engine. This chapter introduces RDDs and shows how RDDs can be created and executed using RDD Transformations and Actions.
3
PySpark SQL & DataFrames
In this chapter, you'll learn about Spark SQL which is a Spark module for structured data processing. It provides a programming abstraction called DataFrames and can also act as a distributed SQL query engine. This chapter shows how Spark SQL allows you to use DataFrames in Python.
4
Machine Learning with PySpark MLlib
PySpark MLlib is the Apache Spark scalable machine learning library in Python consisting of common learning algorithms and utilities. Throughout this last chapter, you'll learn important Machine Learning algorithms. You will build a movie recommendation engine and a spam filter, and use k-means clustering.
Big Data Fundamentals with PySpark
หลักสูตรเสร็จสมบูรณ์ ได้รับใบรับรองความสำเร็จ
เพิ่มข้อมูลรับรองนี้ลงในโปรไฟล์ LinkedIn, ประวัติย่อ หรือเรซูเม่ของคุณแชร์ลงในโซเชียลมีเดียและในรายงานประเมินผลการปฏิบัติงานของคุณลงทะเบียนเลย
พัฒนาทักษะด้านข้อมูลของคุณด้วย DataCamp for Mobile
พัฒนาทักษะได้ทุกที่ทุกเวลาด้วยคอร์สเรียนบนมือถือและแบบฝึกหัดเขียนโค้ดประจำวัน 5 นาทีของเรา