Kurs
Uczenie maszynowe z PySpark
ZaawansowanyPoziom umiejętności
Zaktualizowano 11.2025
SparkMachine Learning4 godz.16 filmów56 Ćwiczeń4,550 XP29,676Zaświadczenie o ukończeniu
Utwórz bezpłatne konto
Kontynuuj z GooglePokaż więcej opcjilub
Kontynuując, akceptujesz nasze Warunki korzystania, naszą Politykę prywatności oraz to, że Twoje dane są przechowywane w USA.
Uwielbiany przez kursantów z tysięcy firm
Szkolisz zespół?
Wypróbuj dla firmOpis kursu
Naucz się korzystać z Apache Spark do uczenia maszynowego
Spark to potężne, uniwersalne narzędzie do pracy z Big Data. Spark transparentnie obsługuje rozkład zadań obliczeniowych w klastrze. Oznacza to, że operacje są szybkie, ale pozwala Ci to również skupić się na analizie, zamiast martwić się o szczegóły techniczne. W tym kursie nauczysz się, jak wprowadzać dane do Sparka, a następnie zagłębisz się w trzy podstawowe algorytmy uczenia maszynowego w Sparku: Regresja liniowa, regresja logistyczna/klasyfikatory oraz tworzenie potoków.Buduj i testuj drzewa decyzyjne
Budowanie własnych drzew decyzyjnych to świetny sposób na rozpoczęcie poznawania modeli uczenia maszynowego. Użyjesz algorytmu zwanego „Recursive Partitioning”, aby podzielić dane na dwie klasy i znaleźć w swoich danych predyktor, który zapewnia najbardziej informacyjny podział tych dwóch klas, a następnie powtórzyć tę czynność dla kolejnych węzłów. Następnie możesz użyć swojego drzewa decyzyjnego do tworzenia prognoz na podstawie nowych danych.Opanuj regresję logistyczną i liniową w PySpark
Regresja logistyczna i liniowa to podstawowe techniki uczenia maszynowego obsługiwane przez PySpark. Nauczysz się budować i oceniać modele regresji logistycznej, a następnie tworzyć modele regresji liniowej, aby dopracować swoje predyktory tak, by obejmowały tylko najbardziej istotne opcje.Pod koniec kursu będziesz pewnie wykorzystywać nowo zdobytą wiedzę z zakresu machine learning, dzięki praktycznym zadaniom i zestawom danych do ćwiczeń, które znajdziesz w całym kursie.
Wymagania wstępne
Supervised Learning with scikit-learnIntroduction to PySpark1
Introduction
Spark is a framework for working with Big Data. In this chapter you'll cover some background about Spark and Machine Learning. You'll then find out how to connect to Spark using Python and load CSV data.
2
Classification
Now that you are familiar with getting data into Spark, you'll move onto building two types of classification model: Decision Trees and Logistic Regression. You'll also find out about a few approaches to data preparation.
3
Regression
Next you'll learn to create Linear Regression models. You'll also find out how to augment your data by engineering new predictors as well as a robust approach to selecting only the most relevant predictors.
4
Ensembles & Pipelines
Finally you'll learn how to make your models more efficient. You'll find out how to use pipelines to make your code clearer and easier to maintain. Then you'll use cross-validation to better test your models and select good model parameters. Finally you'll dabble in two types of ensemble model.
Uczenie maszynowe z PySpark
Kurs ukończony
Zdobądź zaświadczenie o ukończeniu
Dodaj to poświadczenie do swojego profilu LinkedIn, CV lub życiorysuUdostępnij to w mediach społecznościowych i podczas oceny wyników pracyZapisz się teraz
Dołącz do ponad 19 milionów kursantów i zacznij Uczenie maszynowe z PySpark już dziś!
Utwórz bezpłatne konto
Kontynuuj z GooglePokaż więcej opcjilub
Kontynuując, akceptujesz nasze Warunki korzystania, naszą Politykę prywatności oraz to, że Twoje dane są przechowywane w USA.
Rozwijaj swoje umiejętności w zakresie danych dzięki DataCamp dla urządzeń mobilnych
Rób postępy w podróży dzięki naszym kursom mobilnym i codziennym 5-minutowym wyzwaniom kodowania.