본문으로 바로가기
R

강의

R에서 대치(Imputation)로 결측치 다루기

고급기술 수준
업데이트됨 2022. 10.
누락 데이터를 진단·시각화하고 다양한 대치 기법으로 처리하세요. 결과 향상을 위한 실전 팁도 제공합니다.
무료로 강의 시작
RData Manipulation4시간13 동영상49 연습 문제4,200 XP6,073성취 증명서

무료 계정을 만드세요

또는

계속 진행하시면 당사의 이용약관, 개인정보처리방침 및 귀하의 데이터가 미국에 저장되는 것에 동의하시는 것입니다.

수천 개 기업의 학습자들이 사랑하는

Group

2명 이상을 교육하시나요?

DataCamp for Business 체험

강의 설명

결측치는 어디에나 있습니다. 누락된 값을 채우는 과정을 대치(imputation)라고 하며, 결측치를 올바르게 채우는 방법을 아는 것은 정확한 예측을 만들고 경쟁에서 앞서 나가는 데 꼭 필요한 역량입니다. 이 강의에서는 시각화와 통계적 검정을 활용해 결측 패턴을 파악하고, 통계 및 Machine Learning 모델 모음을 사용해 데이터를 대치하는 방법을 배웁니다. 또한 어떤 상황에 어떤 대치 방법이 가장 적합한지 선택할 수 있도록 의사결정 능력도 기르게 됩니다. 마지막으로, 대치에서 비롯되는 불확실성을 추론과 예측에 반영해 결과를 더 견고하고 신뢰할 수 있게 만드는 방법을 익힙니다.

선수 조건

Intermediate Regression in RDealing With Missing Data in R
1

The Problem of Missing Data

In this chapter, you’ll find out why missing data can be a risk when analyzing a dataset. You’ll be introduced to the three missing data mechanisms and learn how to recognize them using statistical tests and visualization tools.
챕터 시작
2

Donor-Based Imputation

Get to know the taxonomy of imputation methods and learn three donor-based techniques: mean, hot-deck, and k-Nearest-Neighbors imputation. You’ll look under the hood to see how these methods work, before learning how to apply them to a real-world tropical weather dataset. Along the way, you’ll also learn useful tricks that you can use to make them work even better for your problems.
챕터 시작
3

Model-Based Imputation

It’s time to learn how to use statistical and machine learning models, such as linear regression, logistic regression, and random forests, to impute missing data. In this chapter, you’ll look into how the models make their predictions and use this knowledge to draw the imputed values from conditional distributions. This is important as it ensures your imputations are more varied and plausible, making them more similar to the true data.
챕터 시작
4

Uncertainty from Imputation

Imputed values are not set in stone. They are just estimates and estimates come with some uncertainty. In this final chapter, you’ll discover how bootstrapping and chained equation using the mice package can be used to incorporate imputation uncertainty into your models and analyses to make them more reliable and robust.
챕터 시작
R에서 대치(Imputation)로 결측치 다루기
강의
완료

수료증 획득

LinkedIn 프로필, 이력서 또는 CV에 이 자격증을 추가하세요
소셜 미디어와 성과 평가에서 공유하세요
지금 등록

19백만 명 이상의 학습자와 함께 R에서 대치(Imputation)로 결측치 다루기을(를) 시작하세요!

무료 계정을 만드세요

또는

계속 진행하시면 당사의 이용약관, 개인정보처리방침 및 귀하의 데이터가 미국에 저장되는 것에 동의하시는 것입니다.

DataCamp for Mobile을 통해 데이터 분석 능력을 향상시키세요.

모바일 강좌와 매일 5분 코딩 챌린지를 통해 이동 중에도 학습 효과를 높이세요.