Przejdź do głównej treści
Strona głównaSpark

Kurs

Uczenie maszynowe z PySpark

ZaawansowanyPoziom umiejętności
Zaktualizowano 11.2025
Naucz się tworzyć prognozy z danych w Apache Spark, używając drzew decyzyjnych, regresji logistycznej, regresji liniowej, zespołów i potoków.
Zacznij kurs za darmo
SparkMachine Learning
4 godz.
16 filmów
56 Ćwiczeń
4,550 XP
29,676
Zaświadczenie o ukończeniu

Utwórz bezpłatne konto

Kontynuuj z GooglePokaż więcej opcji

lub


Kontynuując, akceptujesz nasze Warunki korzystania, naszą Politykę prywatności oraz to, że Twoje dane są przechowywane w USA.

Uwielbiany przez kursantów z tysięcy firm

Group

Szkolisz zespół?

Wypróbuj dla firm

Opis kursu

Naucz się korzystać z Apache Spark do uczenia maszynowego

Spark to potężne, uniwersalne narzędzie do pracy z Big Data. Spark transparentnie obsługuje rozkład zadań obliczeniowych w klastrze. Oznacza to, że operacje są szybkie, ale pozwala Ci to również skupić się na analizie, zamiast martwić się o szczegóły techniczne. W tym kursie nauczysz się, jak wprowadzać dane do Sparka, a następnie zagłębisz się w trzy podstawowe algorytmy uczenia maszynowego w Sparku: Regresja liniowa, regresja logistyczna/klasyfikatory oraz tworzenie potoków.

Buduj i testuj drzewa decyzyjne

Budowanie własnych drzew decyzyjnych to świetny sposób na rozpoczęcie poznawania modeli uczenia maszynowego. Użyjesz algorytmu zwanego „Recursive Partitioning”, aby podzielić dane na dwie klasy i znaleźć w swoich danych predyktor, który zapewnia najbardziej informacyjny podział tych dwóch klas, a następnie powtórzyć tę czynność dla kolejnych węzłów. Następnie możesz użyć swojego drzewa decyzyjnego do tworzenia prognoz na podstawie nowych danych.

Opanuj regresję logistyczną i liniową w PySpark

Regresja logistyczna i liniowa to podstawowe techniki uczenia maszynowego obsługiwane przez PySpark. Nauczysz się budować i oceniać modele regresji logistycznej, a następnie tworzyć modele regresji liniowej, aby dopracować swoje predyktory tak, by obejmowały tylko najbardziej istotne opcje.

Pod koniec kursu będziesz pewnie wykorzystywać nowo zdobytą wiedzę z zakresu machine learning, dzięki praktycznym zadaniom i zestawom danych do ćwiczeń, które znajdziesz w całym kursie.

Wymagania wstępne

Supervised Learning with scikit-learnIntroduction to PySpark
1

Introduction

Spark is a framework for working with Big Data. In this chapter you'll cover some background about Spark and Machine Learning. You'll then find out how to connect to Spark using Python and load CSV data.
Zacznij rozdział
2

Classification

Now that you are familiar with getting data into Spark, you'll move onto building two types of classification model: Decision Trees and Logistic Regression. You'll also find out about a few approaches to data preparation.
Zacznij rozdział
Uczenie maszynowe z PySpark
Kurs
ukończony

Zdobądź zaświadczenie o ukończeniu

Dodaj to poświadczenie do swojego profilu LinkedIn, CV lub życiorysu
Udostępnij to w mediach społecznościowych i podczas oceny wyników pracy
Zapisz się teraz

Dołącz do ponad 19 milionów kursantów i zacznij Uczenie maszynowe z PySpark już dziś!

Utwórz bezpłatne konto

Kontynuuj z GooglePokaż więcej opcji

lub


Kontynuując, akceptujesz nasze Warunki korzystania, naszą Politykę prywatności oraz to, że Twoje dane są przechowywane w USA.

Rozwijaj swoje umiejętności w zakresie danych dzięki DataCamp dla urządzeń mobilnych

Rób postępy w podróży dzięki naszym kursom mobilnym i codziennym 5-minutowym wyzwaniom kodowania.