Перейти к основному содержимому
ДомSpark

Course

Big Data Fundamentals with PySpark

ПередовойУровень мастерства
Обновлено 02.2025
Learn the fundamentals of working with big data with PySpark.
Начать Курс Бесплатно
SparkData Engineering4 ч16 videos55 Exercises4,600 XP64,506Свидетельство о достижениях

Создайте бесплатный аккаунт

или

Продолжая, вы принимаете наши Условия использования, нашу Политику конфиденциальности и подтверждаете, что ваши данные хранятся в США.

Пользуется популярностью среди обучающихся в тысячах компаний.

Group

Обучение двух или более человек?

Попробуйте DataCamp for Business

Описание курса

There's been a lot of buzz about Big Data over the past few years, and it's finally become mainstream for many companies. But what is this Big Data? This course covers the fundamentals of Big Data via PySpark. Spark is a "lightning fast cluster computing" framework for Big Data. It provides a general data processing platform engine and lets you run programs up to 100x faster in memory, or 10x faster on disk, than Hadoop. You’ll use PySpark, a Python package for Spark programming and its powerful, higher-level libraries such as SparkSQL, MLlib (for machine learning), etc. You will explore the works of William Shakespeare, analyze Fifa 2018 data and perform clustering on genomic datasets. At the end of this course, you will have gained an in-depth understanding of PySpark and its application to general Big Data analysis.

Предварительные требования

Introduction to Python
1

Introduction to Big Data analysis with Spark

This chapter introduces the exciting world of Big Data, as well as the various concepts and different frameworks for processing Big Data. You will understand why Apache Spark is considered the best framework for BigData.
Начало Главы
2

Programming in PySpark RDD’s

3

PySpark SQL & DataFrames

4

Machine Learning with PySpark MLlib

PySpark MLlib is the Apache Spark scalable machine learning library in Python consisting of common learning algorithms and utilities. Throughout this last chapter, you'll learn important Machine Learning algorithms. You will build a movie recommendation engine and a spam filter, and use k-means clustering.
Начало Главы
Big Data Fundamentals with PySpark
Курс
завершен

Получите свидетельство о достижениях

Добавьте эти данные в свой профиль LinkedIn, резюме или CV.
Поделитесь этим в социальных сетях и в своем отчете об оценке эффективности работы.
Запишитесь Прямо Сейчас

Присоединяйтесь 19 миллионов учащихся и начните Big Data Fundamentals with PySpark сегодня!

Создайте бесплатный аккаунт

или

Продолжая, вы принимаете наши Условия использования, нашу Политику конфиденциальности и подтверждаете, что ваши данные хранятся в США.

Развивайте свои навыки работы с данными с помощью DataCamp для мобильных устройств.

Успевайте в обучении на ходу с помощью наших мобильных курсов и ежедневных 5-минутных заданий по программированию.