メインコンテンツへスキップ
ホームPython

トラック

PySparkを用いたビッグデータ

更新日 2026/03
PySpark APIを使用して、Apache Sparkによるビッグデータの処理方法と効率的な活用方法を習得しましょう。
トラックを無料で開始
Pythonデータのインポートとクリーニング25時間8,447

無料アカウントを作成

または

続行すると、弊社の利用規約プライバシーポリシーに同意し、データが米国に保存されることに同意したことになります。

数千の企業の学習者に愛されています

Group

2名以上のトレーニングをお考えですか?

DataCamp for Businessを試す

トラック概要

PySparkを用いたビッグデータ

Apache Sparkを習得することで、データスキルを向上させましょう。Spark Python APIであるPySparkを活用することで、大規模データセットを用いた並列計算を実現し、高性能な機械学習の準備が整います。データのクリーニングから特徴量の作成、機械学習モデルの実装に至るまで、Sparkを用いてエンドツーエンドのワークフローを実行していただきます。本コースは、人気のMovieLensデータセットとMillion Songsデータセットを用いて、レコメンデーションエンジンの構築を行うことで終了いたします。

前提条件

このトラックに前提条件はありません
  • Course

    1

    PySpark入門

    PySparkを習得し、ビッグデータを容易に扱えるようになろう。大規模なデータセットを処理し、クエリを実行し、最適化して、強力な分析を実現する方法を学びましょう!

  • Course

    Learn the gritty details that data scientists are spending 70-80% of their time on; data wrangling and feature engineering.

  • Course

    Learn how to make predictions from data with Apache Spark, using decision trees, logistic regression, linear regression, ensembles, and pipelines.

  • Project

    ボーナス

    Building a Demand Forecasting Model

    Use PySpark to build an e-commerce forecasting model!

PySparkを用いたビッグデータ
6 コース
トラック完了

修了証明書を取得

この資格をLinkedInプロフィール、履歴書、CVに追加しましょう
ソーシャルメディアや人事評価で共有しましょう
今すぐ登録

19百万人を超える学習者と一緒にPySparkを用いたビッグデータ を今日から始めましょう!

無料アカウントを作成

または

続行すると、弊社の利用規約プライバシーポリシーに同意し、データが米国に保存されることに同意したことになります。

DataCamp for Mobileでデータスキルを磨きましょう

モバイル コースと毎日の 5 分間のコーディング チャレンジで、外出先でも進歩できます。