Corso
Pulizia dei dati in Python
IntermedioLivello di competenza
Aggiornato 12/2025
PythonData Preparation4 h13 video44 Esercizi3,500 XP150K+Attestato di conseguimento
Crea il tuo account gratuito
Continua con GoogleMostra più opzionio
Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.
Preferito dagli studenti di migliaia di aziende
Formare un team?
Prova per il BusinessDescrizione del corso
Scopri come pulire i dati in Python
La preparazione dei dati è fondamentale: i data scientist dedicano l'80% del loro tempo alla pulizia e alla manipolazione dei dati e solo il 20% del loro tempo all'analisi effettiva. La pulizia dei dati è un passaggio fondamentale per ogni data scientist, perché analizzare dati sporchi può portare a conclusioni sbagliate.In questo corso imparerai a riconoscere, capire e risolvere vari problemi di pulizia dei dati in Python, da quelli più semplici a quelli più complicati. Ti occuperai di tipi di dati non corretti, controllerai che i tuoi dati siano nel range giusto, gestirai i dati mancanti, farai il collegamento dei record e molto altro ancora!
Scopri come pulire diversi tipi di dati
Il primo capitolo del corso parla dei problemi più comuni con i dati e di come risolverli. Prima di tutto, capirai i tipi di dati di base e come gestirli uno per uno. Poi, dovrai mettere dei limiti di intervallo e togliere i dati che sono uguali.L'ultimo capitolo parla del record linkage, uno strumento super utile per mettere insieme più set di dati. Imparerai come collegare i record calcolando quanto sono simili le stringhe. Infine, userai le tue nuove competenze per unire due set di dati relativi alle recensioni dei ristoranti in un unico set di dati master pulito.
Acquisisci sicurezza nella pulizia dei dati
Alla fine del corso, avrai la sicurezza necessaria per pulire dati di vario tipo e usare il record linkage per unire più set di dati. La pulizia dei dati è una competenza fondamentale per i data scientist. Se vuoi saperne di più sulla pulizia dei dati in Python e le sue applicazioni, dai un'occhiata ai seguenti percorsi: Data Scientist con Python e importazione e pulizia dei dati con Python.Prerequisiti
Python ToolboxJoining Data with pandas1
Problemi comuni nei dati
In questo capitolo imparerai a superare alcuni dei problemi più comuni dei dati sporchi. Convertirai i tipi di dato, applicherai vincoli di intervallo per rimuovere i punti dati futuri e eliminerai i duplicati per evitare doppi conteggi.
2
Problemi con dati testuali e categorici
I dati categorici e testuali sono spesso tra le parti più disordinate di un insieme di dati a causa della loro natura non strutturata. In questo capitolo imparerai a correggere incongruenze di spazi bianchi e maiuscole/minuscole nelle etichette di categoria, a unire più categorie in una sola e a riformattare le stringhe per garantire coerenza.
3
Problemi avanzati sui dati
In questo capitolo affronterai problemi di pulizia dei dati più avanzati, come assicurarti che i pesi siano tutti espressi in chilogrammi invece che in libbre. Acquisirai anche competenze preziose per verificare che i valori siano stati sommati correttamente e che i valori mancanti non influenzino negativamente le tue analisi.
4
Record linkage
Il record linkage è una tecnica potente usata per unire più insiemi di dati quando i valori presentano refusi o grafie diverse. In questo capitolo imparerai a collegare i record calcolando la somiglianza tra stringhe; poi userai le nuove competenze per unire due insiemi di recensioni di ristoranti in un unico insieme principale pulito.
Pulizia dei dati in Python
Corso completato
Ottieni Attestato di conseguimento
Aggiungi questa certificazione al tuo profilo LinkedIn, al curriculum o al CVCondividila sui social e nella valutazione delle tue performanceIscriviti ora
Unisciti a oltre 19 milioni di studenti e inizia Pulizia dei dati in Python oggi!
Crea il tuo account gratuito
Continua con GoogleMostra più opzionio
Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.
Aumenta le tue competenze sui dati con l'app di DataCamp
Avanza ovunque ti trovi con i nostri corsi per dispositivi mobili e le nostre sfide di programmazione quotidiane da 5 minuti.