Przejdź do głównej treści
Strona głównaSpark

Kurs

Wprowadzenie do PySpark

ŚredniozaawansowanyPoziom umiejętności
Zaktualizowano 01.2026
Opanuj PySpark, by z łatwością obsługiwać big data — ucz się przetwarzać, zapytywać i optymalizować ogromne zbiory danych do zaawansowanej analityki!
Zacznij kurs za darmo
SparkData Engineering
4 godz.
11 filmów
36 Ćwiczeń
2,850 XP
29,195
Zaświadczenie o ukończeniu

Utwórz bezpłatne konto

Kontynuuj z GooglePokaż więcej opcji

lub


Kontynuując, akceptujesz nasze Warunki korzystania, naszą Politykę prywatności oraz to, że Twoje dane są przechowywane w USA.

Uwielbiany przez kursantów z tysięcy firm

Group

Szkolisz zespół?

Wypróbuj dla firm

Opis kursu

Ten kurs jest idealny dla inżynierów danych, data scientistów i praktyków machine learning, którzy chcą efektywnie pracować z dużymi zbiorami danych. Niezależnie od tego, czy przechodzisz z narzędzi takich jak Pandas, czy po raz pierwszy zagłębiasz się w technologie big data, ten kurs oferuje solidne wprowadzenie do PySpark i rozproszonego przetwarzania danych.

Dlaczego Spark? Dlaczego teraz?

Odkryj szybkość i skalowalność Apache Spark — potężnej platformy stworzonej do pracy z big data. Dzięki interaktywnym lekcjom i praktycznym ćwiczeniom zobaczysz, jak przetwarzanie w pamięci Spark daje mu przewagę nad tradycyjnymi frameworkami, takimi jak Hadoop. Zaczniesz od konfiguracji sesji Spark i zagłębisz się w kluczowe komponenty, takie jak Resilient Distributed Datasets (RDD) i DataFrames. Naucz się z łatwością filtrować, grupować i łączyć zbiory danych, pracując na przykładach z życia wziętych.

Rozwiń swoje umiejętności w Pythonie i SQL dla Big Data

Dowiedz się, jak wykorzystać PySpark SQL do zapytań i zarządzania danymi, używając znanej składni SQL. Zajmij się schematami, złożonymi typami danych i funkcjami definiowanymi przez użytkownika (UDF), jednocześnie rozwijając umiejętności w zakresie cache’owania i optymalizacji wydajności systemów rozproszonych.

Zbuduj fundamenty Big Data

Po ukończeniu tego kursu będziesz mieć pewność, że potrafisz obsługiwać, wykonywać zapytania i przetwarzać big data za pomocą PySpark. Dzięki tym podstawowym umiejętnościom będziesz gotowy(-a) zgłębiać zaawansowane zagadnienia, takie jak uczenie maszynowe i analiza big data.

Wymagania wstępne

Introduction to SQLData Manipulation with pandas
1

Introduction to Apache Spark and PySpark

A General introduction to PySpark and distributed computing. This section introduces PySpark, PySpark DataFrames, and RDDs.
Zacznij rozdział
2

PySpark in Python

A continuation of DataFrames and complex datatypes. This section expands on what DataFrames offer in PySpark and introduces some Spark SQL concepts.
Zacznij rozdział
Wprowadzenie do PySpark
Kurs
ukończony

Zdobądź zaświadczenie o ukończeniu

Dodaj to poświadczenie do swojego profilu LinkedIn, CV lub życiorysu
Udostępnij to w mediach społecznościowych i podczas oceny wyników pracy
Zapisz się teraz

Dołącz do ponad 19 milionów kursantów i zacznij Wprowadzenie do PySpark już dziś!

Utwórz bezpłatne konto

Kontynuuj z GooglePokaż więcej opcji

lub


Kontynuując, akceptujesz nasze Warunki korzystania, naszą Politykę prywatności oraz to, że Twoje dane są przechowywane w USA.

Rozwijaj swoje umiejętności w zakresie danych dzięki DataCamp dla urządzeń mobilnych

Rób postępy w podróży dzięki naszym kursom mobilnym i codziennym 5-minutowym wyzwaniom kodowania.