コース説明

このコースでは、R を使ってネットワークデータによる最先端の予測分析を学びます。ネットワーク分析の目的は、ネットワーク上のノードがどのクラスに属するか（例：解約者か否か、不正者か否か、延滞者か否かなど）を予測することです。そのために、ネットワークとその基盤となる構造から得られる情報を予測に活用する方法を解説します。具体的には、ネットワークの特徴量を非ネットワークの特徴量に追加し、モデルの性能を高める「特徴量化（featurization）」の考え方を紹介します。本コースでは、igraph パッケージを用いて、解約（churn）シナリオの顧客ネットワークを生成・ラベル付けし、ネットワーク学習の基礎を学びます。次に、homophily、dyadicity、heterophilicity を取り上げ、ネットワークの探索的な重要インサイトを得る方法を学びます。その後、igraph パッケージの機能を使って、ノード中心および近傍ベースのさまざまなネットワーク特徴量を計算します。さらに、Google の PageRank アルゴリズムを使って特徴量を算出し、その予測力を実証的に検証します。最後に、ネットワークからフラットなデータセットを生成し、ロジスティック回帰やランダムフォレストで分析する方法を学びます。

前提条件

Network Analysis in R Supervised Learning in R: Classification

Introduction, networks and labelled networks

In this chapter you will be introduced to labelled networks, network learning and the challanges that can arise.

Motivation: social networks and predictive analytics

コース説明

修了証明書を取得

.css-nklxlk{color:var(--wf-brand--main, #03EF62);}19百万人を超える学習者と共にR で学ぶネットワークデータの予測分析を始めましょう！

無料アカウントを作成

DataCamp for Mobileでデータスキルを磨きましょう

19百万人を超える学習者と共にR で学ぶネットワークデータの予測分析を始めましょう！