Перейти к основному содержимому
ГлавнаяShell

Курс

Data Processing in Shell

Средний уровеньУровень навыков
Обновлено 10.2025
Learn powerful command-line skills to download, process, and transform data, including machine learning pipeline.
Начать курс бесплатно
ShellData Manipulation
4 ч
13 видео
46 Упражнений
3,550 XP
22,934
Справка об успешном завершении

Создать бесплатный аккаунт

Продолжить через GoogleПоказать больше вариантов

или


Продолжая, вы принимаете наши Условия использования, нашу Политику конфиденциальности и соглашаетесь с тем, что ваши данные хранятся в США.

Любимая обучающимися из тысяч компаний

Group

Обучаете команду?

Попробуйте для бизнеса

Описание курса

We live in a busy world with tight deadlines. As a result, we fall back on what is familiar and easy, favoring GUI interfaces like Visual Studio and RStudio. However, taking the time to learn data analysis on the command line is a great long-term investment because it makes us stronger and more productive data people.In this course, we will take a practical approach to learn simple, powerful, and data-specific command-line skills. Using publicly available Spotify datasets, we will learn how to download, process, clean, and transform data, all via the command line. We will also learn advanced techniques such as command-line based SQL database operations. Finally, we will combine the powers of command line and Python to build a data pipeline for automating a predictive model.

Необходимые условия

Introduction to ShellIntermediate PythonIntermediate SQL
1

Downloading Data on the Command Line

In this chapter, we learn how to download data files from web servers via the command line. In the process, we also learn about documentation manuals, option flags, and multi-file processing.
Начать главу
2

Data Cleaning and Munging on the Command Line

We continue our data journey from data downloading to data processing. In this chapter, we utilize the command line library csvkit to convert, preview, filter and manipulate files to prepare our data for further analyses.
Начать главу
3

Database Operations on the Command Line

4

Data Pipeline on the Command Line

In the last chapter, we bridge the connection between command line and other data science languages and learn how they can work together. Using Python as a case study, we learn to execute Python on the command line, to install dependencies using the package manager pip, and to build an entire model pipeline using the command line.
Начать главу
Data Processing in Shell
Курс
завершён

Получить сертификат об окончании

Добавьте эту квалификацию в профиль LinkedIn, резюме или CV
Поделитесь в социальных сетях и в обзоре эффективности
Записаться сейчас

Присоединяйтесь к более чем 19 миллионам обучающихся и начните Data Processing in Shell уже сегодня!

Создать бесплатный аккаунт

Продолжить через GoogleПоказать больше вариантов

или


Продолжая, вы принимаете наши Условия использования, нашу Политику конфиденциальности и соглашаетесь с тем, что ваши данные хранятся в США.

Развивайте свои навыки работы с данными с помощью DataCamp для мобильных устройств.

Успевайте в обучении на ходу с помощью наших мобильных курсов и ежедневных 5-минутных заданий по программированию.