Kurs
Wprowadzenie do PySpark
ŚredniozaawansowanyPoziom umiejętności
Zaktualizowano 01.2026
SparkData Engineering4 godz.11 filmów36 Ćwiczeń2,850 XP29,195Zaświadczenie o ukończeniu
Utwórz bezpłatne konto
Kontynuuj z GooglePokaż więcej opcjilub
Kontynuując, akceptujesz nasze Warunki korzystania, naszą Politykę prywatności oraz to, że Twoje dane są przechowywane w USA.
Uwielbiany przez kursantów z tysięcy firm
Szkolisz zespół?
Wypróbuj dla firmOpis kursu
Dlaczego Spark? Dlaczego teraz?
Odkryj szybkość i skalowalność Apache Spark — potężnej platformy stworzonej do pracy z big data. Dzięki interaktywnym lekcjom i praktycznym ćwiczeniom zobaczysz, jak przetwarzanie w pamięci Spark daje mu przewagę nad tradycyjnymi frameworkami, takimi jak Hadoop. Zaczniesz od konfiguracji sesji Spark i zagłębisz się w kluczowe komponenty, takie jak Resilient Distributed Datasets (RDD) i DataFrames. Naucz się z łatwością filtrować, grupować i łączyć zbiory danych, pracując na przykładach z życia wziętych.Rozwiń swoje umiejętności w Pythonie i SQL dla Big Data
Dowiedz się, jak wykorzystać PySpark SQL do zapytań i zarządzania danymi, używając znanej składni SQL. Zajmij się schematami, złożonymi typami danych i funkcjami definiowanymi przez użytkownika (UDF), jednocześnie rozwijając umiejętności w zakresie cache’owania i optymalizacji wydajności systemów rozproszonych.Zbuduj fundamenty Big Data
Po ukończeniu tego kursu będziesz mieć pewność, że potrafisz obsługiwać, wykonywać zapytania i przetwarzać big data za pomocą PySpark. Dzięki tym podstawowym umiejętnościom będziesz gotowy(-a) zgłębiać zaawansowane zagadnienia, takie jak uczenie maszynowe i analiza big data.Wymagania wstępne
Introduction to SQLData Manipulation with pandas1
Introduction to Apache Spark and PySpark
A General introduction to PySpark and distributed computing. This section introduces PySpark, PySpark DataFrames, and RDDs.
2
PySpark in Python
A continuation of DataFrames and complex datatypes. This section expands on what DataFrames offer in PySpark and introduces some Spark SQL concepts.
3
Introduction to PySpark SQL
Delve into leveraging Spark SQL and PySpark for scalable data processing, combining SQL's simplicity with PySpark's distributed computing power to handle large datasets efficiently.
Wprowadzenie do PySpark
Kurs ukończony
Zdobądź zaświadczenie o ukończeniu
Dodaj to poświadczenie do swojego profilu LinkedIn, CV lub życiorysuUdostępnij to w mediach społecznościowych i podczas oceny wyników pracyZapisz się teraz
Dołącz do ponad 19 milionów kursantów i zacznij Wprowadzenie do PySpark już dziś!
Utwórz bezpłatne konto
Kontynuuj z GooglePokaż więcej opcjilub
Kontynuując, akceptujesz nasze Warunki korzystania, naszą Politykę prywatności oraz to, że Twoje dane są przechowywane w USA.
Rozwijaj swoje umiejętności w zakresie danych dzięki DataCamp dla urządzeń mobilnych
Rób postępy w podróży dzięki naszym kursom mobilnym i codziennym 5-minutowym wyzwaniom kodowania.