メインコンテンツへスキップ
Python

Tracks

PySparkを用いたビッグデータ

更新 2026/03
PySpark APIを使用して、Apache Sparkによるビッグデータの処理方法と効率的な活用方法を習得しましょう。
無料でトラックを開始

含まれるものプレミアム or チーム

Pythonデータのインポートとクリーニング25時間7,801

無料アカウントを作成

または

続行すると、弊社の利用規約プライバシーポリシーに同意し、データが米国に保存されることに同意したことになります。

数千社の学習者に愛用されています

Group

2人以上をトレーニングしますか?

DataCamp for Businessを試す

トラックの説明

PySparkを用いたビッグデータ

Apache Sparkを習得することで、データスキルを向上させましょう。Spark Python APIであるPySparkを活用することで、大規模データセットを用いた並列計算を実現し、高性能な機械学習の準備が整います。データのクリーニングから特徴量の作成、機械学習モデルの実装に至るまで、Sparkを用いてエンドツーエンドのワークフローを実行していただきます。本コースは、人気のMovieLensデータセットとMillion Songsデータセットを用いて、レコメンデーションエンジンの構築を行うことで終了いたします。

前提条件

このコースには前提条件はありません
  • Course

    1

    PySpark入門

    PySparkを習得し、ビッグデータを容易に扱えるようになろう。大規模なデータセットを処理し、クエリを実行し、最適化して、強力な分析を実現する方法を学びましょう!

  • Course

    Learn the gritty details that data scientists are spending 70-80% of their time on; data wrangling and feature engineering.

  • Course

    Learn how to make predictions from data with Apache Spark, using decision trees, logistic regression, linear regression, ensembles, and pipelines.

  • Project

    ボーナス

    Building a Demand Forecasting Model

    Use PySpark to build an e-commerce forecasting model!

PySparkを用いたビッグデータ
6 Courses
トラック完了

達成証明書を取得する

この資格情報をLinkedInプロフィール、履歴書、またはCVに追加してください
ソーシャルメディアや業績評価で共有する

含まれるものプレミアム or チーム

今すぐ登録

参加する 19百万人の学習者 今すぐPySparkを用いたビッグデータ を始めましょう!

無料アカウントを作成

または

続行すると、弊社の利用規約プライバシーポリシーに同意し、データが米国に保存されることに同意したことになります。