メインコンテンツへスキップ
ホームR

コース

R による欠損データの補完処理

上級スキルレベル
更新日 2022/10
欠損データを診断・可視化し、さまざまな補完手法で対処。結果を改善するコツも紹介。
コースを無料で開始
RData Manipulation
4時間
13 ビデオ
49 演習
4,200 XP
6,218
修了証明書

無料アカウントを作成

Googleで続行その他のオプションを表示

または


続行すると、弊社の利用規約プライバシーポリシーに同意し、データが米国に保存されることに同意したことになります。

何千もの企業の従業員が支持

Group

チームのトレーニングを担当していますか?

Businessをお試しください

コース説明

欠損データはあらゆる場面に存在します。欠損値を埋める処理は「補完(インピュテーション)」と呼ばれ、正確な予測を行い、分析の質を高めるうえで欠かせないスキルです。このコースでは、可視化や統計的検定を活用して欠損データのパターンを把握する方法を学びます。さらに、統計モデルや機械学習モデルを使ったデータ補完の手法も習得します。どの補完方法が状況に適しているかを判断する力も身につけましょう。最後に、補完に伴う不確実性を推論や予測に組み込み、結果をより信頼性の高いものにする方法を学びます。

前提条件

Intermediate Regression in RDealing With Missing Data in R
1

欠損データの問題

この章では、データセットの分析において欠損データがなぜリスクになるかを学びます。欠損データの3つのメカニズムを紹介し、統計的検定と可視化ツールを使ってそれらを見分ける方法を習得します。
チャプターを開始
2

ドナーベースの補完

補完手法の分類体系を学び、平均値補完、ホットデック補完、k近傍法補完という3つのドナーベース手法を習得します。各手法の仕組みを詳しく確認したうえで、実際の熱帯地域の気象データセットへの適用方法を学びます。また、これらの手法をより効果的に活用するための実践的なコツも紹介します。
3

モデルベースの補完

線形回帰、ロジスティック回帰、ランダムフォレストなどの統計モデルや機械学習モデルを使って欠損データを補完する方法を学びましょう。この章では、モデルがどのように予測を行うかを深く理解し、その知識をもとに条件付き分布から補完値を導出する方法を習得します。これにより、補完値がより多様かつ妥当なものになり、実際のデータに近い結果が得られます。
4

補完に伴う不確実性

補完値は確定した値ではありません。あくまで推定値であり、推定には必ず不確実性が伴います。この最終章では、ブートストラップ法と mice パッケージを使った連鎖方程式法により、補完の不確実性をモデルや分析に組み込み、結果をより信頼性の高いものにする方法を学びます。
R による欠損データの補完処理
コース完了

修了証明書を取得

この修了書をLinkedInや履歴書、CVに追加しましょう
ソーシャルメディアや人事評価で共有しましょう
今すぐ登録

19百万人を超える学習者と共にR による欠損データの補完処理を始めましょう!

無料アカウントを作成

Googleで続行その他のオプションを表示

または


続行すると、弊社の利用規約プライバシーポリシーに同意し、データが米国に保存されることに同意したことになります。

DataCamp for Mobileでデータスキルを磨きましょう

モバイル コースと毎日の 5 分間のコーディング チャレンジで、外出先でも進歩できます。