Sariți la conținutul principal
AcasăSpark

Curs

Big Data Fundamentals with PySpark

AvansatNivel de competențe
Actualizat 02.2025
Learn the fundamentals of working with big data with PySpark.
Începe cursul gratuit
SparkData Engineering
4 h
16 videoclipuri
55 Exerciții
4,600 XP
65,224
Certificat de realizare

Creează-ți contul gratuit

Continuă cu GoogleArată mai multe opțiuni

sau


Continuând, accepți Termenii de utilizare, Politica de confidențialitate și faptul că datele tale sunt stocate în SUA.

Îndrăgit de cursanți din mii de companii

Group

Formare pentru o echipă?

Încearcă pentru afaceri

Descrierea cursului

There's been a lot of buzz about Big Data over the past few years, and it's finally become mainstream for many companies. But what is this Big Data? This course covers the fundamentals of Big Data via PySpark. Spark is a "lightning fast cluster computing" framework for Big Data. It provides a general data processing platform engine and lets you run programs up to 100x faster in memory, or 10x faster on disk, than Hadoop. You’ll use PySpark, a Python package for Spark programming and its powerful, higher-level libraries such as SparkSQL, MLlib (for machine learning), etc. You will explore the works of William Shakespeare, analyze Fifa 2018 data and perform clustering on genomic datasets. At the end of this course, you will have gained an in-depth understanding of PySpark and its application to general Big Data analysis.

Cerințe prealabile

Introduction to Python
1

Introduction to Big Data analysis with Spark

This chapter introduces the exciting world of Big Data, as well as the various concepts and different frameworks for processing Big Data. You will understand why Apache Spark is considered the best framework for BigData.
Începe capitolul
2

Programming in PySpark RDD’s

The main abstraction Spark provides is a resilient distributed dataset (RDD), which is the fundamental and backbone data type of this engine. This chapter introduces RDDs and shows how RDDs can be created and executed using RDD Transformations and Actions.
Începe capitolul
4

Machine Learning with PySpark MLlib

Big Data Fundamentals with PySpark
Curs
finalizat

Obține diploma de absolvire

Adaugă această acreditare la profilul tău LinkedIn, CV sau rezumat
Distribuie pe rețelele de socializare și în evaluarea ta de performanță
Înscrie-te acum

Alătură-te celor peste 19 de milioane de cursanți și începe Big Data Fundamentals with PySpark astăzi!

Creează-ți contul gratuit

Continuă cu GoogleArată mai multe opțiuni

sau


Continuând, accepți Termenii de utilizare, Politica de confidențialitate și faptul că datele tale sunt stocate în SUA.

Dezvoltați-vă abilitățile de gestionare a datelor cu DataCamp pentru mobil

Fă progrese din mers cu cursurile noastre mobile și provocările zilnice de programare de 5 minute.