Курс
Big Data Fundamentals with PySpark
Продвинутый уровеньУровень навыков
Обновлено 02.2025
SparkData Engineering4 ч16 видео55 Упражнений4,600 XP65,217Справка об успешном завершении
Создать бесплатный аккаунт
Продолжить через GoogleПоказать больше вариантовили
Продолжая, вы принимаете наши Условия использования, нашу Политику конфиденциальности и соглашаетесь с тем, что ваши данные хранятся в США.
Любимая обучающимися из тысяч компаний
Обучаете команду?
Попробуйте для бизнесаОписание курса
Необходимые условия
Introduction to Python1
Introduction to Big Data analysis with Spark
This chapter introduces the exciting world of Big Data, as well as the various concepts and different frameworks for processing Big Data. You will understand why Apache Spark is considered the best framework for BigData.
2
Programming in PySpark RDD’s
The main abstraction Spark provides is a resilient distributed dataset (RDD), which is the fundamental and backbone data type of this engine. This chapter introduces RDDs and shows how RDDs can be created and executed using RDD Transformations and Actions.
3
PySpark SQL & DataFrames
In this chapter, you'll learn about Spark SQL which is a Spark module for structured data processing. It provides a programming abstraction called DataFrames and can also act as a distributed SQL query engine. This chapter shows how Spark SQL allows you to use DataFrames in Python.
4
Machine Learning with PySpark MLlib
PySpark MLlib is the Apache Spark scalable machine learning library in Python consisting of common learning algorithms and utilities. Throughout this last chapter, you'll learn important Machine Learning algorithms. You will build a movie recommendation engine and a spam filter, and use k-means clustering.
Big Data Fundamentals with PySpark
Курс завершён
Получить сертификат об окончании
Добавьте эту квалификацию в профиль LinkedIn, резюме или CVПоделитесь в социальных сетях и в обзоре эффективностиЗаписаться сейчас
Присоединяйтесь к более чем 19 миллионам обучающихся и начните Big Data Fundamentals with PySpark уже сегодня!
Создать бесплатный аккаунт
Продолжить через GoogleПоказать больше вариантовили
Продолжая, вы принимаете наши Условия использования, нашу Политику конфиденциальности и соглашаетесь с тем, что ваши данные хранятся в США.
Развивайте свои навыки работы с данными с помощью DataCamp для мобильных устройств.
Успевайте в обучении на ходу с помощью наших мобильных курсов и ежедневных 5-минутных заданий по программированию.