コース
R による欠損データの補完処理
上級スキルレベル
更新日 2022/10
RData Manipulation4時間13 ビデオ49 演習4,200 XP6,218修了証明書
無料アカウントを作成
Googleで続行その他のオプションを表示または
何千もの企業の従業員が支持
チームのトレーニングを担当していますか?
Businessをお試しくださいコース説明
前提条件
Intermediate Regression in RDealing With Missing Data in R1
欠損データの問題
この章では、データセットの分析において欠損データがなぜリスクになるかを学びます。欠損データの3つのメカニズムを紹介し、統計的検定と可視化ツールを使ってそれらを見分ける方法を習得します。
2
ドナーベースの補完
補完手法の分類体系を学び、平均値補完、ホットデック補完、k近傍法補完という3つのドナーベース手法を習得します。各手法の仕組みを詳しく確認したうえで、実際の熱帯地域の気象データセットへの適用方法を学びます。また、これらの手法をより効果的に活用するための実践的なコツも紹介します。
3
モデルベースの補完
線形回帰、ロジスティック回帰、ランダムフォレストなどの統計モデルや機械学習モデルを使って欠損データを補完する方法を学びましょう。この章では、モデルがどのように予測を行うかを深く理解し、その知識をもとに条件付き分布から補完値を導出する方法を習得します。これにより、補完値がより多様かつ妥当なものになり、実際のデータに近い結果が得られます。
4
補完に伴う不確実性
補完値は確定した値ではありません。あくまで推定値であり、推定には必ず不確実性が伴います。この最終章では、ブートストラップ法と
mice パッケージを使った連鎖方程式法により、補完の不確実性をモデルや分析に組み込み、結果をより信頼性の高いものにする方法を学びます。R による欠損データの補完処理
コース完了 19百万人を超える学習者と共にR による欠損データの補完処理を始めましょう!
無料アカウントを作成
Googleで続行その他のオプションを表示または
DataCamp for Mobileでデータスキルを磨きましょう
モバイル コースと毎日の 5 分間のコーディング チャレンジで、外出先でも進歩できます。