コース
Anomaly Detection in Python
中級スキルレベル
更新日 2025/11
PythonProbability & Statistics4時間16 ビデオ59 演習4,950 XP7,198修了証明書
無料アカウントを作成
Googleで続行その他のオプションを表示または
何千もの企業の従業員が支持
チームのトレーニングを担当していますか?
Businessをお試しくださいコース説明
データ分析における異常を見つける
ほぼすべてのデータセットには極端な値や異常値が含まれており、統計的な分析を続ける前にそれらを検出して対処することが重要です。 手を加えずに放置すると、異常値は分析を簡単に乱し、機械学習モデルの性能を歪める可能性があります。
Isolation ForestやLocal Outlier Factorのような推定器の使い方を学ぶ
このコースでは、Pythonを活用してさまざまな異常検知手法を実装します。 極端値を視覚的に見つけ出し、単変量データセットに対しては中央値絶対偏差のような実証済みの統計手法を活用します。 多変量データについては、Isolation Forest、k-Nearest-Neighbors、Local Outlier Factor などの推定器の使い方を学びます。 さらに、複数の外れ値分類器をアンサンブルして、低リスクの最終推定器を構築する方法も学びます。 Pythonを使った異常検知という、データサイエンスに欠かせないツールを身につけられます。
Pythonの統計ツールキットを拡張しよう
より優れた異常検知は、データの理解を深め、特にシステムの挙動に関する根本原因分析とコミュニケーションをより良くします。 既存のPythonスキルにこのスキルを加えることで、データのクレンジング、不正検知、システム障害の特定に役立ちます。
前提条件
Supervised Learning with scikit-learn1
単変量の外れ値検出
この章では、ヒストグラム、散布図、箱ひげ図、z スコア、修正 z スコアを用いて、1 次元データにおける外れ値を検出する手法を学びます。
2
PyOD による Isolation Forest
この章では、Isolation Forest アルゴリズムの仕組みを基礎から応用まで学びます。Isolation Tree の構築方法、PyOD の IForest の主要パラメータとそのチューニング方法、そして外れ値の確率スコアを用いて IForest の出力をどのように解釈するかを探ります。
3
距離・密度ベースのアルゴリズム
ツリーベースの外れ値分類器に続いて、距離・密度ベースの検知手法のクラスを学びます。この分野で高い効果が実証されている KNN と Local Outlier Factor の分類器の使い方を身につけます。
4
時系列の異常検知と外れ値アンサンブル
この章では、時系列データセットに対して異常検知を行い、外れ値アンサンブルを活用して予測をより安定で信頼できるものにする方法を学びます。
Anomaly Detection in Python
コース完了 19百万人を超える学習者と共にAnomaly Detection in Pythonを始めましょう!
無料アカウントを作成
Googleで続行その他のオプションを表示または
DataCamp for Mobileでデータスキルを磨きましょう
モバイル コースと毎日の 5 分間のコーディング チャレンジで、外出先でも進歩できます。