Uczenie maszynowe z PySpark

ZaawansowanyPoziom umiejętności

Zaktualizowano 11.2025

Naucz się tworzyć prognozy z danych w Apache Spark, używając drzew decyzyjnych, regresji logistycznej, regresji liniowej, zespołów i potoków.

Opis kursu

Naucz się korzystać z Apache Spark do uczenia maszynowego

Spark to potężne, uniwersalne narzędzie do pracy z Big Data. Spark transparentnie obsługuje rozkład zadań obliczeniowych w klastrze. Oznacza to, że operacje są szybkie, ale pozwala Ci to również skupić się na analizie, zamiast martwić się o szczegóły techniczne. W tym kursie nauczysz się, jak wprowadzać dane do Sparka, a następnie zagłębisz się w trzy podstawowe algorytmy uczenia maszynowego w Sparku: Regresja liniowa, regresja logistyczna/klasyfikatory oraz tworzenie potoków.

Buduj i testuj drzewa decyzyjne

Budowanie własnych drzew decyzyjnych to świetny sposób na rozpoczęcie poznawania modeli uczenia maszynowego. Użyjesz algorytmu zwanego „Recursive Partitioning”, aby podzielić dane na dwie klasy i znaleźć w swoich danych predyktor, który zapewnia najbardziej informacyjny podział tych dwóch klas, a następnie powtórzyć tę czynność dla kolejnych węzłów. Następnie możesz użyć swojego drzewa decyzyjnego do tworzenia prognoz na podstawie nowych danych.

Opanuj regresję logistyczną i liniową w PySpark

Regresja logistyczna i liniowa to podstawowe techniki uczenia maszynowego obsługiwane przez PySpark. Nauczysz się budować i oceniać modele regresji logistycznej, a następnie tworzyć modele regresji liniowej, aby dopracować swoje predyktory tak, by obejmowały tylko najbardziej istotne opcje.

Pod koniec kursu będziesz pewnie wykorzystywać nowo zdobytą wiedzę z zakresu machine learning, dzięki praktycznym zadaniom i zestawom danych do ćwiczeń, które znajdziesz w całym kursie.

Wymagania wstępne

Supervised Learning with scikit-learn Introduction to PySpark

Introduction

Spark is a framework for working with Big Data. In this chapter you'll cover some background about Spark and Machine Learning. You'll then find out how to connect to Spark using Python and load CSV data.

Machine Learning & Spark

50 XP

Characteristics of Spark

50 XP

Components in a Spark Cluster

50 XP

Connecting to Spark

Opis kursu

Naucz się korzystać z Apache Spark do uczenia maszynowego

Buduj i testuj drzewa decyzyjne

Opanuj regresję logistyczną i liniową w PySpark

Zdobądź zaświadczenie o ukończeniu

Dołącz do ponad .css-nklxlk{color:var(--wf-brand--main, #03EF62);}19 milionów kursantów i zacznij Uczenie maszynowe z PySpark już dziś!

Utwórz bezpłatne konto

Rozwijaj swoje umiejętności w zakresie danych dzięki DataCamp dla urządzeń mobilnych

Dołącz do ponad 19 milionów kursantów i zacznij Uczenie maszynowe z PySpark już dziś!