Wprowadzenie do PySpark

ŚredniozaawansowanyPoziom umiejętności

Zaktualizowano 01.2026

Opanuj PySpark, by z łatwością obsługiwać big data — ucz się przetwarzać, zapytywać i optymalizować ogromne zbiory danych do zaawansowanej analityki!

Opis kursu

Ten kurs jest idealny dla inżynierów danych, data scientistów i praktyków machine learning, którzy chcą efektywnie pracować z dużymi zbiorami danych. Niezależnie od tego, czy przechodzisz z narzędzi takich jak Pandas, czy po raz pierwszy zagłębiasz się w technologie big data, ten kurs oferuje solidne wprowadzenie do PySpark i rozproszonego przetwarzania danych.

Dlaczego Spark? Dlaczego teraz?

Odkryj szybkość i skalowalność Apache Spark — potężnej platformy stworzonej do pracy z big data. Dzięki interaktywnym lekcjom i praktycznym ćwiczeniom zobaczysz, jak przetwarzanie w pamięci Spark daje mu przewagę nad tradycyjnymi frameworkami, takimi jak Hadoop. Zaczniesz od konfiguracji sesji Spark i zagłębisz się w kluczowe komponenty, takie jak Resilient Distributed Datasets (RDD) i DataFrames. Naucz się z łatwością filtrować, grupować i łączyć zbiory danych, pracując na przykładach z życia wziętych.

Rozwiń swoje umiejętności w Pythonie i SQL dla Big Data

Dowiedz się, jak wykorzystać PySpark SQL do zapytań i zarządzania danymi, używając znanej składni SQL. Zajmij się schematami, złożonymi typami danych i funkcjami definiowanymi przez użytkownika (UDF), jednocześnie rozwijając umiejętności w zakresie cache’owania i optymalizacji wydajności systemów rozproszonych.

Zbuduj fundamenty Big Data

Po ukończeniu tego kursu będziesz mieć pewność, że potrafisz obsługiwać, wykonywać zapytania i przetwarzać big data za pomocą PySpark. Dzięki tym podstawowym umiejętnościom będziesz gotowy(-a) zgłębiać zaawansowane zagadnienia, takie jak uczenie maszynowe i analiza big data.

Wymagania wstępne

Introduction to SQL Data Manipulation with pandas

Introduction to Apache Spark and PySpark

A General introduction to PySpark and distributed computing. This section introduces PySpark, PySpark DataFrames, and RDDs.

Opis kursu

Dlaczego Spark? Dlaczego teraz?

Rozwiń swoje umiejętności w Pythonie i SQL dla Big Data

Zbuduj fundamenty Big Data

Zdobądź zaświadczenie o ukończeniu

Dołącz do ponad .css-nklxlk{color:var(--wf-brand--main, #03EF62);}19 milionów kursantów i zacznij Wprowadzenie do PySpark już dziś!

Utwórz bezpłatne konto

Rozwijaj swoje umiejętności w zakresie danych dzięki DataCamp dla urządzeń mobilnych

Dołącz do ponad 19 milionów kursantów i zacznij Wprowadzenie do PySpark już dziś!