Przejdź do głównej treści
Strona głównaSpark

Kurs

Podstawy Big Data z PySpark

ZaawansowanyPoziom umiejętności
Zaktualizowano 02.2025
Poznaj podstawy pracy z big data w PySpark.
Zacznij kurs za darmo
SparkData Engineering
4 godz.
16 filmów
55 Ćwiczeń
4,600 XP
65,217
Zaświadczenie o ukończeniu

Utwórz bezpłatne konto

Kontynuuj z GooglePokaż więcej opcji

lub


Kontynuując, akceptujesz nasze Warunki korzystania, naszą Politykę prywatności oraz to, że Twoje dane są przechowywane w USA.

Uwielbiany przez kursantów z tysięcy firm

Group

Szkolisz zespół?

Wypróbuj dla firm

Opis kursu

W ostatnich latach temat Big Data stał się niezwykle popularny i trafił do głównego nurtu w wielu firmach. Czym jednak właściwie jest Big Data? Ten kurs omawia podstawy Big Data za pomocą PySpark. Spark to framework do obliczeń klastrowych, który działa błyskawicznie. Zapewnia ogólną platformę przetwarzania danych i pozwala uruchamiać programy nawet 100 razy szybciej w pamięci – lub 10 razy szybciej na dysku – niż Hadoop. Będziesz korzystać z PySpark, pakietu Pythona do programowania w Spark, oraz jego zaawansowanych bibliotek, takich jak SparkSQL czy MLlib (do uczenia maszynowego). Przeanalizujesz dzieła Williama Szekspira, zbadasz dane z Fify 2018 i przeprowadzisz grupowanie na zbiorach danych genomicznych. Po ukończeniu kursu będziesz mieć solidne zrozumienie PySpark i jego zastosowania w ogólnej analizie Big Data.

Wymagania wstępne

Introduction to Python
1

Introduction to Big Data analysis with Spark

This chapter introduces the exciting world of Big Data, as well as the various concepts and different frameworks for processing Big Data. You will understand why Apache Spark is considered the best framework for BigData.
Zacznij rozdział
2

Programming in PySpark RDD’s

The main abstraction Spark provides is a resilient distributed dataset (RDD), which is the fundamental and backbone data type of this engine. This chapter introduces RDDs and shows how RDDs can be created and executed using RDD Transformations and Actions.
Zacznij rozdział
4

Machine Learning with PySpark MLlib

Podstawy Big Data z PySpark
Kurs
ukończony

Zdobądź zaświadczenie o ukończeniu

Dodaj to poświadczenie do swojego profilu LinkedIn, CV lub życiorysu
Udostępnij to w mediach społecznościowych i podczas oceny wyników pracy
Zapisz się teraz

Dołącz do ponad 19 milionów kursantów i zacznij Podstawy Big Data z PySpark już dziś!

Utwórz bezpłatne konto

Kontynuuj z GooglePokaż więcej opcji

lub


Kontynuując, akceptujesz nasze Warunki korzystania, naszą Politykę prywatności oraz to, że Twoje dane są przechowywane w USA.

Rozwijaj swoje umiejętności w zakresie danych dzięki DataCamp dla urządzeń mobilnych

Rób postępy w podróży dzięki naszym kursom mobilnym i codziennym 5-minutowym wyzwaniom kodowania.