Sariți la conținutul principal
AcasăSpark

Curs

Introducere în PySpark

IntermediarNivel de competențe
Actualizat 01.2026
Stăpânește PySpark pentru a gestiona big data cu ușurință—învață să procesezi, interoghezi și optimizezi seturi de date uriașe pentru analize puternice!
Începe cursul gratuit
SparkData Engineering
4 h
11 videoclipuri
36 Exerciții
2,850 XP
29,195
Certificat de realizare

Creează-ți contul gratuit

Continuă cu GoogleArată mai multe opțiuni

sau


Continuând, accepți Termenii de utilizare, Politica de confidențialitate și faptul că datele tale sunt stocate în SUA.

Îndrăgit de cursanți din mii de companii

Group

Formare pentru o echipă?

Încearcă pentru afaceri

Descrierea cursului

Acest curs este perfect pentru ingineri de date, oameni de știință ai datelor și practicieni în machine learning care vor să lucreze eficient cu seturi mari de date. Fie că faci tranziția de la instrumente precum Pandas sau descoperi pentru prima dată tehnologiile de big data, acest curs oferă o introducere solidă în PySpark și procesarea distribuită a datelor.

De ce Spark? De ce acum?

Descoperă viteza și scalabilitatea Apache Spark, cadrul puternic conceput pentru gestionarea big data. Prin lecții interactive și exerciții practice, vei vedea cum procesarea în memorie a Spark îi oferă un avantaj față de framework-uri tradiționale precum Hadoop. Vei începe prin configurarea sesiunilor Spark și vei aprofunda componentele de bază, precum Resilient Distributed Datasets (RDD-uri) și DataFrames. Învață să filtrezi, să grupezi și să îmbini seturi de date cu ușurință, lucrând pe exemple din lumea reală.

Îmbunătățește-ți abilitățile de Python și SQL pentru Big Data

Învață cum să folosești PySpark SQL pentru a interoga și gestiona date folosind sintaxa SQL familiară. Abordează schemele, tipurile de date complexe și funcțiile definite de utilizator (UDF-uri), în timp ce îți dezvolți abilitățile în caching și optimizarea performanței pentru sistemele distribuite.

Construiește-ți bazele în Big Data

Până la finalul acestui curs, vei avea încrederea necesară pentru a gestiona, interoga și procesa big data folosind PySpark. Cu aceste abilități fundamentale, vei fi pregătit să explorezi subiecte avansate precum machine learning și analiza big data.

Cerințe prealabile

Introduction to SQLData Manipulation with pandas
1

Introduction to Apache Spark and PySpark

A General introduction to PySpark and distributed computing. This section introduces PySpark, PySpark DataFrames, and RDDs.
Începe capitolul
2

PySpark in Python

A continuation of DataFrames and complex datatypes. This section expands on what DataFrames offer in PySpark and introduces some Spark SQL concepts.
Începe capitolul
Introducere în PySpark
Curs
finalizat

Obține diploma de absolvire

Adaugă această acreditare la profilul tău LinkedIn, CV sau rezumat
Distribuie pe rețelele de socializare și în evaluarea ta de performanță
Înscrie-te acum

Alătură-te celor peste 19 de milioane de cursanți și începe Introducere în PySpark astăzi!

Creează-ți contul gratuit

Continuă cu GoogleArată mai multe opțiuni

sau


Continuând, accepți Termenii de utilizare, Politica de confidențialitate și faptul că datele tale sunt stocate în SUA.

Dezvoltați-vă abilitățile de gestionare a datelor cu DataCamp pentru mobil

Fă progrese din mers cu cursurile noastre mobile și provocările zilnice de programare de 5 minute.