Преобразование данных с помощью Spark SQL в Databricks

Средний уровеньУровень навыков

Обновлено 07.2026

Постройте сквозные data pipelines — от очистки и агрегации до streaming и orchestration.

Создать бесплатный аккаунт

Продолжить через Google

Показать больше вариантов

или

Продолжая, вы принимаете наши Условия использования, Политику конфиденциальности и соглашаетесь с хранением ваших данных в США.

Описание курса

Готовы работать с реальными данными в больших масштабах? Этот курс научит вас преобразовывать крупные наборы данных с помощью Spark SQL и PySpark в Databricks. Вы освоите формирование и очистку данных, научитесь выполнять агрегации с оптимизированными соединениями и применять оконные функции для продвинутой аналитики. Кроме того, вы настроите потоковую обработку файлов с отказоустойчивыми контрольными точками и сохранение результатов в виде таблиц Delta. В итоге вы сможете самостоятельно оркестрировать многошаговые производственные пайплайны с помощью Databricks Workflows и Lakeflow Declarative Pipelines.

Необходимые условия

Introduction to Databricks SQL Introduction to PySpark

Загрузка и подготовка данных

В этой главе вы научитесь работать с ноутбуками Databricks, загружать CSV-данные в Spark DataFrames и преобразовывать данные с помощью PySpark и SQL.

Описание курса

Получить сертификат об окончании

Присоединяйтесь к более чем .css-nklxlk{color:var(--wf-brand--main, #03EF62);}19 миллионам обучающихся и начните Преобразование данных с помощью Spark SQL в Databricks уже сегодня!

Создать бесплатный аккаунт

Развивайте свои навыки работы с данными с помощью DataCamp для мобильных устройств.

Присоединяйтесь к более чем 19 миллионам обучающихся и начните Преобразование данных с помощью Spark SQL в Databricks уже сегодня!