Curs
Introducere în PySpark
IntermediarNivel de competențe
Actualizat 01.2026
SparkData Engineering4 h11 videoclipuri36 Exerciții2,850 XP29,195Certificat de realizare
Creează-ți contul gratuit
Continuă cu GoogleArată mai multe opțiunisau
Continuând, accepți Termenii de utilizare, Politica de confidențialitate și faptul că datele tale sunt stocate în SUA.
Îndrăgit de cursanți din mii de companii
Formare pentru o echipă?
Încearcă pentru afaceriDescrierea cursului
De ce Spark? De ce acum?
Descoperă viteza și scalabilitatea Apache Spark, cadrul puternic conceput pentru gestionarea big data. Prin lecții interactive și exerciții practice, vei vedea cum procesarea în memorie a Spark îi oferă un avantaj față de framework-uri tradiționale precum Hadoop. Vei începe prin configurarea sesiunilor Spark și vei aprofunda componentele de bază, precum Resilient Distributed Datasets (RDD-uri) și DataFrames. Învață să filtrezi, să grupezi și să îmbini seturi de date cu ușurință, lucrând pe exemple din lumea reală.Îmbunătățește-ți abilitățile de Python și SQL pentru Big Data
Învață cum să folosești PySpark SQL pentru a interoga și gestiona date folosind sintaxa SQL familiară. Abordează schemele, tipurile de date complexe și funcțiile definite de utilizator (UDF-uri), în timp ce îți dezvolți abilitățile în caching și optimizarea performanței pentru sistemele distribuite.Construiește-ți bazele în Big Data
Până la finalul acestui curs, vei avea încrederea necesară pentru a gestiona, interoga și procesa big data folosind PySpark. Cu aceste abilități fundamentale, vei fi pregătit să explorezi subiecte avansate precum machine learning și analiza big data.Cerințe prealabile
Introduction to SQLData Manipulation with pandas1
Introduction to Apache Spark and PySpark
A General introduction to PySpark and distributed computing. This section introduces PySpark, PySpark DataFrames, and RDDs.
2
PySpark in Python
A continuation of DataFrames and complex datatypes. This section expands on what DataFrames offer in PySpark and introduces some Spark SQL concepts.
3
Introduction to PySpark SQL
Delve into leveraging Spark SQL and PySpark for scalable data processing, combining SQL's simplicity with PySpark's distributed computing power to handle large datasets efficiently.
Introducere în PySpark
Curs finalizat
Obține diploma de absolvire
Adaugă această acreditare la profilul tău LinkedIn, CV sau rezumatDistribuie pe rețelele de socializare și în evaluarea ta de performanțăÎnscrie-te acum
Alătură-te celor peste 19 de milioane de cursanți și începe Introducere în PySpark astăzi!
Creează-ți contul gratuit
Continuă cu GoogleArată mai multe opțiunisau
Continuând, accepți Termenii de utilizare, Politica de confidențialitate și faptul că datele tale sunt stocate în SUA.
Dezvoltați-vă abilitățile de gestionare a datelor cu DataCamp pentru mobil
Fă progrese din mers cu cursurile noastre mobile și provocările zilnice de programare de 5 minute.