メインコンテンツへスキップ

ホーム Python

コース

Anomaly Detection in Python

中級スキルレベル

更新日 2025/11

この4時間のコースで、データ分析の異常を検出し、Pythonの統計ツールキットを拡張します。

コースを無料で開始

PythonProbability & Statistics

4時間

16 ビデオ

59 演習

4,950 XP

7,198

修了証明書

何千もの企業の従業員が支持

チームのトレーニングを担当していますか？

Businessをお試しください

コース説明

データ分析における異常を見つける

ほぼすべてのデータセットには極端な値や異常値が含まれており、統計的な分析を続ける前にそれらを検出して対処することが重要です。手を加えずに放置すると、異常値は分析を簡単に乱し、機械学習モデルの性能を歪める可能性があります。

Isolation ForestやLocal Outlier Factorのような推定器の使い方を学ぶ

このコースでは、Pythonを活用してさまざまな異常検知手法を実装します。極端値を視覚的に見つけ出し、単変量データセットに対しては中央値絶対偏差のような実証済みの統計手法を活用します。多変量データについては、Isolation Forest、k-Nearest-Neighbors、Local Outlier Factor などの推定器の使い方を学びます。さらに、複数の外れ値分類器をアンサンブルして、低リスクの最終推定器を構築する方法も学びます。 Pythonを使った異常検知という、データサイエンスに欠かせないツールを身につけられます。

Pythonの統計ツールキットを拡張しよう

より優れた異常検知は、データの理解を深め、特にシステムの挙動に関する根本原因分析とコミュニケーションをより良くします。既存のPythonスキルにこのスキルを加えることで、データのクレンジング、不正検知、システム障害の特定に役立ちます。

前提条件

Supervised Learning with scikit-learn

1

単変量の外れ値検出

この章では、ヒストグラム、散布図、箱ひげ図、z スコア、修正 z スコアを用いて、1 次元データにおける外れ値を検出する手法を学びます。

アノマリーと外れ値とは何ですか？

5数要約を出力する

外れ値検出のためのヒストグラム

外れ値検出のための散布図

箱ひげ図とIQR

外れ値検出のための箱ひげ図

IQR を使った外れ値の範囲を計算する

外れ値の閾値を使ってフィルタリングする

zスコアを使った異常検知

zスコアで外れ値を見つける

PyOD で修正 z スコアを使う

チャプターを開始

2

PyOD による Isolation Forest

この章では、Isolation Forest アルゴリズムの仕組みを基礎から応用まで学びます。Isolation Tree の構築方法、PyOD の IForest の主要パラメータとそのチューニング方法、そして外れ値の確率スコアを用いて IForest の出力をどのように解釈するかを探ります。

Isolation Forestを始めよう

単変量外れ値と多変量外れ値の違い

IForest で外れ値を検出する

Isolation Forest のハイパーパラメータの概要

IForest の主要パラメータ

contamination の選び方

n_estimators を選ぶ

理論を確かめる

Isolation Forest のハイパーパラメータチューニング

contamination のチューニング

複数のハイパーパラメータをチューニングする

IForest の出力を読み解く

IForestで分類する別の方法

外れ値確率の活用

チャプターを開始

3

距離・密度ベースのアルゴリズム

ツリーベースの外れ値分類器に続いて、距離・密度ベースの検知手法のクラスを学びます。この分野で高い効果が実証されている KNN と Local Outlier Factor の分類器の使い方を身につけます。

外れ値検出のためのKNN

はじめての KNN

外れ値確率を用いた KNN

外れ値に強い特徴量スケーリング

ユークリッド距離を手計算で求める

SciPy でユークリッド距離を求める

標準化を練習しましょう

QuantileTransformer を試す

KNN のハイパーパラメータ

距離尺度の違いを見分ける

マンハッタン距離を手計算で求める

n_neighbors のチューニング

集約方法のチューニング

Local Outlier Factor（LOF）

はじめての LOF

外れ値確率付き LOF

チャプターを開始

4

時系列の異常検知と外れ値アンサンブル

この章では、時系列データセットに対して異常検知を行い、外れ値アンサンブルを活用して予測をより安定で信頼できるものにする方法を学びます。

時系列データの導入

DateTime 列を扱う

DateTimeIndex の作成

時系列に対するMAD

時系列へのIsolation Forest

外れ値検出のための時系列分解

分解の練習

残差への当てはめ

外れ値分類器のアンサンブル

データセットの一部のみをスケーリングする

手動の外れ値アンサンブル - 配列の作成

外れ値の確率を保存する

確率の集約としきい値処理

特定された外れ値への対処方法

外れ値が生じる理由を分類する

外れ値を削除すべきとき

外れ値に対する穏当な対処法

おめでとうございます！

チャプターを開始

Anomaly Detection in Python

コース完了

修了証明書を取得

この修了書をLinkedInや履歴書、CVに追加しましょう
ソーシャルメディアや人事評価で共有しましょう今すぐ登録

19百万人を超える学習者と共にAnomaly Detection in Pythonを始めましょう！

DataCamp for Mobileでデータスキルを磨きましょう

モバイルコースと毎日の 5 分間のコーディングチャレンジで、外出先でも進歩できます。