Przejdź do głównej treści
Strona główna

Spark courses

With Spark, data is read into memory, operations are performed, and the results are written back, resulting in faster execution. Learn core principles and common packages on DataCamp.

Utwórz bezpłatne konto

Kontynuuj z GooglePokaż więcej opcji

lub


Kontynuując, akceptujesz nasze Warunki korzystania, naszą Politykę prywatności oraz to, że Twoje dane są przechowywane w USA.
Group

Szkolisz 2 lub więcej osób?

Wypróbuj DataCamp for Business

Recommended for Spark beginners

Build your Spark skills with interactive courses curated by real-world experts

Kurs

Podstawy PySpark

ŚredniozaawansowanyPoziom umiejętności
4.7+
601 recenzji
4 godz.
Naucz się wdrażać rozproszone zarządzanie danymi i uczenie maszynowe w Spark z użyciem pakietu PySpark.

Ścieżka

Big Data z PySpark

3.6+
6 recenzji
25 godz.
Opanuj przetwarzanie dużych zbiorów danych i efektywne wykorzystywanie ich z Apache Spark przy użyciu API PySpark.

Nie wiesz, od czego zacząć?

Wykonaj ocenę

Przeglądaj kursy i ścieżki Spark

Kurs

Wprowadzenie do PySpark

ŚredniozaawansowanyPoziom umiejętności
4.7+
2536 recenzji
4 godz.
Opanuj PySpark, by z łatwością obsługiwać big data — ucz się przetwarzać, zapytywać i optymalizować ogromne zbiory danych do zaawansowanej analityki!

Kurs

Czyszczenie danych w PySpark

ZaawansowanyPoziom umiejętności
4.7+
466 recenzji
4 godz.
Naucz się czyścić dane za pomocą Apache Spark w Pythonie.

Kurs

Uczenie maszynowe z PySpark

ZaawansowanyPoziom umiejętności
4.8+
689 recenzji
4 godz.
Naucz się tworzyć prognozy z danych w Apache Spark, używając drzew decyzyjnych, regresji logistycznej, regresji liniowej, zespołów i potoków.

Kurs

Wprowadzenie do Spark SQL w Pythonie

ZaawansowanyPoziom umiejętności
4.7+
142 recenzje
4 godz.
Naucz się manipulować danymi i tworzyć zestawy cech machine learning w Spark za pomocą SQL w Pythonie.

Kurs

Podstawy PySpark

ŚredniozaawansowanyPoziom umiejętności
4.7+
601 recenzji
4 godz.
Naucz się wdrażać rozproszone zarządzanie danymi i uczenie maszynowe w Spark z użyciem pakietu PySpark.

Kurs

Inżynieria cech z PySpark

ZaawansowanyPoziom umiejętności
4.8+
286 recenzji
4 godz.
Poznaj szczegóły, na które data scientists poświęcają 70–80% czasu: data wrangling i feature engineering.

Kurs

Wprowadzenie do Spark z pakietem sparklyr w R

ŚredniozaawansowanyPoziom umiejętności
4.7+
81 recenzji
4 godz.
Naucz się analizować duże zbiory danych za pomocą Spark i pakietu sparklyr w R oraz poznaj Spark MLIb w zaledwie 4 godziny.

Kurs

Budowanie silników rekomendacji w PySpark

ZaawansowanyPoziom umiejętności
4.8+
232 recenzje
4 godz.
Poznaj narzędzia i techniki, by wykorzystać własne big data do tworzenia pozytywnych doświadczeń dla użytkowników.

Powiązane zasoby dotyczące Spark

blog

The Top 20 Spark Interview Questions

Essential Spark interview questions with example answers for job-seekers, data professionals, and hiring managers.
Tim Lu's photo

Tim Lu

blog

Flink vs. Spark: A Comprehensive Comparison

Comparing Flink vs. Spark, two open-source frameworks at the forefront of batch and stream processing.
Maria Eugenia Inzaugarat's photo

Maria Eugenia Inzaugarat

8 min

Samouczek

PySpark Tutorial: Getting Started with PySpark

A hands-on PySpark tutorial: install PySpark, explore data with DataFrames, and build a K-Means clustering model for customer segmentation.
Natassha Selvaraj's photo

Natassha Selvaraj

15 min


Ready to apply your skills?

Projects allow you to apply your knowledge to a wide range of datasets to solve real-world problems in your browser

Frequently asked questions

Which Spark course is the best for absolute beginners?

For new learners, DataCamp has three introductory Spark courses across the most popular programming languages:

Introduction to PySpark 

Introduction to Spark with sparklyr in R 

Introduction to Spark SQL in Python Course

Do I need any prior experience to take a Spark course?

You’ll need to have completed an introduction course to the programming language you’re using Spark on. 

All of which you can find here:

Introduction to Python

Introduction to R

Introduction to SQL

Beyond that, anyone can get started with Spark through simple, interactive exercises on DataCamp.

What is PySpark used for?

If you're already familiar with Python and libraries such as Pandas, then PySpark is a good language to learn to create more scalable analyses and pipelines.

Apache Spark is basically a computational engine that works with huge sets of data by processing them in parallel and batch systems. 

Spark is written in Scala, and PySpark was released to support the collaboration of Spark and Python.

How can Spark help my career?

You’ll gain the ability to analyze data and train machine learning models on large-scale datasets—a valuable skill for becoming a data scientist. 

Having the expertise to work with big data frameworks like Apache Spark will set you apart.

What is Apache Spark?

Apache Spark is an open-source, distributed processing system used for big data workloads. 

It utilizes in-memory caching, and optimized query execution for fast analytic queries against data of any size. 

It provides development APIs in Java, Scala, Python, and R, and supports code reuse across multiple workloads—batch processing, interactive queries, real-time analytics, machine learning, and graph processing.

Inne technologie i tematy

technologie

Rozwijaj swoje umiejętności w zakresie danych dzięki DataCamp dla urządzeń mobilnych

Rób postępy w podróży dzięki naszym kursom mobilnym i codziennym 5-minutowym wyzwaniom kodowania.