Vai al contenuto principale
HomeR

Corso

Gestione dei dati mancanti con imputazioni in R

AvanzatoLivello di competenza
Aggiornato 10/2022
Diagnostica, visualizza e gestisci i dati mancanti con diverse tecniche di imputazione e consigli per migliorare i tuoi risultati.
Inizia il corso gratis
RData Manipulation
4 h
13 video
49 Esercizi
4,200 XP
6,218
Attestato di conseguimento

Crea il tuo account gratuito

Continua con GoogleMostra più opzioni

o


Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.

Preferito dagli studenti di migliaia di aziende

Group

Formare un team?

Prova per il Business

Descrizione del corso

I dati mancanti sono ovunque. Il processo di riempire i valori assenti si chiama imputazione, e saperlo fare correttamente è una competenza essenziale se vuoi ottenere previsioni accurate e distinguerti. In questo corso imparerai a usare visualizzazioni e test statistici per riconoscere gli schemi di dati mancanti e a imputare i dati utilizzando una serie di modelli statistici e di Machine Learning. Svilupperai anche capacità decisionali, utili per scegliere il metodo di imputazione più adatto in una determinata situazione. Infine, imparerai a incorporare l’incertezza derivante dall’imputazione nelle tue inferenze e previsioni, rendendole più robuste e affidabili.

Prerequisiti

Intermediate Regression in RDealing With Missing Data in R
1

Il problema dei dati mancanti

In questo capitolo scoprirai perché i dati mancanti possono rappresentare un rischio quando analizzi un insieme di dati. Ti verranno presentati i tre meccanismi dei dati mancanti e imparerai a riconoscerli usando test statistici e strumenti di visualizzazione.
Inizia il capitolo
2

Imputazione basata su donatori

Conosci la tassonomia dei metodi di imputazione e impara tre tecniche basate su donatori: imputazione con media, hot-deck e k-Nearest-Neighbors. Guarderai sotto il cofano per vedere come funzionano questi metodi, per poi imparare ad applicarli a un insieme di dati meteorologici tropicali reali. Lungo il percorso, scoprirai anche trucchi utili per farli funzionare ancora meglio sui tuoi problemi.
Inizia il capitolo
3

Imputazione basata su modelli

È il momento di imparare a usare modelli statistici e di Machine Learning, come regressione lineare, regressione logistica e random forests, per imputare i dati mancanti. In questo capitolo analizzerai come i modelli producono le loro previsioni e userai questa conoscenza per estrarre i valori imputati da distribuzioni condizionali. Questo è importante perché garantisce imputazioni più varie e plausibili, rendendole più simili ai dati reali.
Inizia il capitolo
4

Incertezza dell’imputazione

I valori imputati non sono scolpiti nella pietra. Sono solo stime, e le stime comportano una certa incertezza. In questo capitolo finale scoprirai come il bootstrapping e le equazioni concatenate con il pacchetto mice possono essere usati per incorporare l’incertezza dell’imputazione nei tuoi modelli e nelle tue analisi, rendendoli più affidabili e robusti.
Inizia il capitolo
Gestione dei dati mancanti con imputazioni in R
Corso
completato

Ottieni Attestato di conseguimento

Aggiungi questa certificazione al tuo profilo LinkedIn, al curriculum o al CV
Condividila sui social e nella valutazione delle tue performance
Iscriviti ora

Unisciti a oltre 19 milioni di studenti e inizia Gestione dei dati mancanti con imputazioni in R oggi!

Crea il tuo account gratuito

Continua con GoogleMostra più opzioni

o


Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.

Aumenta le tue competenze sui dati con l'app di DataCamp

Avanza ovunque ti trovi con i nostri corsi per dispositivi mobili e le nostre sfide di programmazione quotidiane da 5 minuti.