Vai al contenuto principale
HomePython

Corso

Pulizia dei dati in Python

IntermedioLivello di competenza
Aggiornato 12/2025
Impara a capire e sistemare i dati sporchi e a sviluppare le abilità necessarie per trasformare i tuoi dati grezzi in informazioni precise!
Inizia il corso gratis
PythonData Preparation
4 h
13 video
44 Esercizi
3,500 XP
150K+
Attestato di conseguimento

Crea il tuo account gratuito

Continua con GoogleMostra più opzioni

o


Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.

Preferito dagli studenti di migliaia di aziende

Group

Formare un team?

Prova per il Business

Descrizione del corso

Scopri come pulire i dati in Python

La preparazione dei dati è fondamentale: i data scientist dedicano l'80% del loro tempo alla pulizia e alla manipolazione dei dati e solo il 20% del loro tempo all'analisi effettiva. La pulizia dei dati è un passaggio fondamentale per ogni data scientist, perché analizzare dati sporchi può portare a conclusioni sbagliate.

In questo corso imparerai a riconoscere, capire e risolvere vari problemi di pulizia dei dati in Python, da quelli più semplici a quelli più complicati. Ti occuperai di tipi di dati non corretti, controllerai che i tuoi dati siano nel range giusto, gestirai i dati mancanti, farai il collegamento dei record e molto altro ancora!

Scopri come pulire diversi tipi di dati

Il primo capitolo del corso parla dei problemi più comuni con i dati e di come risolverli. Prima di tutto, capirai i tipi di dati di base e come gestirli uno per uno. Poi, dovrai mettere dei limiti di intervallo e togliere i dati che sono uguali.

L'ultimo capitolo parla del record linkage, uno strumento super utile per mettere insieme più set di dati. Imparerai come collegare i record calcolando quanto sono simili le stringhe. Infine, userai le tue nuove competenze per unire due set di dati relativi alle recensioni dei ristoranti in un unico set di dati master pulito.

Acquisisci sicurezza nella pulizia dei dati

Alla fine del corso, avrai la sicurezza necessaria per pulire dati di vario tipo e usare il record linkage per unire più set di dati. La pulizia dei dati è una competenza fondamentale per i data scientist. Se vuoi saperne di più sulla pulizia dei dati in Python e le sue applicazioni, dai un'occhiata ai seguenti percorsi: Data Scientist con Python e importazione e pulizia dei dati con Python.

Prerequisiti

Python ToolboxJoining Data with pandas
1

Problemi comuni nei dati

In questo capitolo imparerai a superare alcuni dei problemi più comuni dei dati sporchi. Convertirai i tipi di dato, applicherai vincoli di intervallo per rimuovere i punti dati futuri e eliminerai i duplicati per evitare doppi conteggi.
Inizia il capitolo
2

Problemi con dati testuali e categorici

I dati categorici e testuali sono spesso tra le parti più disordinate di un insieme di dati a causa della loro natura non strutturata. In questo capitolo imparerai a correggere incongruenze di spazi bianchi e maiuscole/minuscole nelle etichette di categoria, a unire più categorie in una sola e a riformattare le stringhe per garantire coerenza.
Inizia il capitolo
3

Problemi avanzati sui dati

In questo capitolo affronterai problemi di pulizia dei dati più avanzati, come assicurarti che i pesi siano tutti espressi in chilogrammi invece che in libbre. Acquisirai anche competenze preziose per verificare che i valori siano stati sommati correttamente e che i valori mancanti non influenzino negativamente le tue analisi.
Inizia il capitolo
4

Record linkage

Il record linkage è una tecnica potente usata per unire più insiemi di dati quando i valori presentano refusi o grafie diverse. In questo capitolo imparerai a collegare i record calcolando la somiglianza tra stringhe; poi userai le nuove competenze per unire due insiemi di recensioni di ristoranti in un unico insieme principale pulito.
Inizia il capitolo
Pulizia dei dati in Python
Corso
completato

Ottieni Attestato di conseguimento

Aggiungi questa certificazione al tuo profilo LinkedIn, al curriculum o al CV
Condividila sui social e nella valutazione delle tue performance
Iscriviti ora

Unisciti a oltre 19 milioni di studenti e inizia Pulizia dei dati in Python oggi!

Crea il tuo account gratuito

Continua con GoogleMostra più opzioni

o


Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.

Aumenta le tue competenze sui dati con l'app di DataCamp

Avanza ovunque ti trovi con i nostri corsi per dispositivi mobili e le nostre sfide di programmazione quotidiane da 5 minuti.