メインコンテンツへスキップ
ホームR

コース

Rで学ぶ異常検知入門

中級スキルレベル
更新日 2024/09
外れ値を見つける統計的検定と、高度な異常スコアリング手法の使い方を学びます。
コースを無料で開始
RProbability & Statistics4時間13 ビデオ47 演習3,900 XP7,313達成証明書

無料アカウントを作成

または

続行すると、弊社の利用規約プライバシーポリシーに同意し、データが米国に保存されることに同意したことになります。

数千の企業の学習者に愛されています

Group

2名以上のトレーニングをお考えですか?

DataCamp for Businessを試す

コース説明

データに不正確または疑わしい記録が含まれていないか心配だけれど、どこから始めればよいかわからない—そんなときに役立つのが異常検知アルゴリズムです。異常検知は、通常とは異なるデータ点を特定するための手法の総称で、不正検出やコンピュータネットワークの悪意ある活動からの保護に不可欠です。本コースでは、外れ値を特定するための統計的検定を学び、local outlier factor や isolation forest のような高度な異常スコアリング手法を使えるようになります。UCI Wine quality データセットで異常なワインを見つけたり、ホルモン測定値の異常から甲状腺疾患の疑い例を検出したりする課題に、異常検知アルゴリズムを適用していきます。

前提条件

Intermediate R
1

Statistical outlier detection

In this chapter, you'll learn how numerical and graphical summaries can be used to informally assess whether data contain unusual points. You'll use a statistical procedure called Grubbs' test to check whether a point is an outlier, and learn about the Seasonal-Hybrid ESD algorithm, which can help identify outliers when the data are a time series.
チャプター開始
2

Distance and density based anomaly detection

In this chapter, you'll learn how to calculate the k-nearest neighbors distance and the local outlier factor, which are used to construct continuous anomaly scores for each data point when the data have multiple features. You'll learn the difference between local and global anomalies and how the two algorithms can help in each case.
チャプター開始
3

Isolation forest

k-nearest neighbors distance and local outlier factor use the distance or relative density of the nearest neighbors to score each point. In this chapter, you'll explore an alternative tree-based approach called an isolation forest, which is a fast and robust method of detecting anomalies that measures how easily points can be separated by randomly splitting the data into smaller and smaller regions.
チャプター開始
4

Comparing performance

You've now been introduced to a few different algorithms for anomaly scoring. In this final chapter, you'll learn to compare the detection performance of the algorithms in instances where labeled anomalies are available. You'll learn to calculate and interpret the precision and recall statistics for an anomaly score, and how to adapt the algorithms so they can accommodate data with categorical features.
チャプター開始
Rで学ぶ異常検知入門
コース完了

修了証明書を取得

この資格をLinkedInプロフィール、履歴書、CVに追加しましょう
ソーシャルメディアや人事評価で共有しましょう
今すぐ登録

19百万人を超える学習者と一緒にRで学ぶ異常検知入門を今日から始めましょう!

無料アカウントを作成

または

続行すると、弊社の利用規約プライバシーポリシーに同意し、データが米国に保存されることに同意したことになります。

DataCamp for Mobileでデータスキルを磨きましょう

モバイル コースと毎日の 5 分間のコーディング チャレンジで、外出先でも進歩できます。