Corso
Pulizia dei dati in Python
IntermedioLivello di competenza
Aggiornato 12/2025Inizia Il Corso Gratis
Incluso conPremium or Team
PythonData Preparation4 h13 video44 Esercizi3,500 XP150K+Attestato di conseguimento
Crea il tuo account gratuito
o
Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.Preferito dagli studenti di migliaia di aziende
Vuoi formare 2 o più persone?
Prova DataCamp for BusinessDescrizione del corso
Scopri come pulire i dati in Python
La preparazione dei dati è fondamentale: i data scientist dedicano l'80% del loro tempo alla pulizia e alla manipolazione dei dati e solo il 20% del loro tempo all'analisi effettiva. La pulizia dei dati è un passaggio fondamentale per ogni data scientist, perché analizzare dati sporchi può portare a conclusioni sbagliate.In questo corso imparerai a riconoscere, capire e risolvere vari problemi di pulizia dei dati in Python, da quelli più semplici a quelli più complicati. Ti occuperai di tipi di dati non corretti, controllerai che i tuoi dati siano nel range giusto, gestirai i dati mancanti, farai il collegamento dei record e molto altro ancora!
Scopri come pulire diversi tipi di dati
Il primo capitolo del corso parla dei problemi più comuni con i dati e di come risolverli. Prima di tutto, capirai i tipi di dati di base e come gestirli uno per uno. Poi, dovrai mettere dei limiti di intervallo e togliere i dati che sono uguali.L'ultimo capitolo parla del record linkage, uno strumento super utile per mettere insieme più set di dati. Imparerai come collegare i record calcolando quanto sono simili le stringhe. Infine, userai le tue nuove competenze per unire due set di dati relativi alle recensioni dei ristoranti in un unico set di dati master pulito.
Acquisisci sicurezza nella pulizia dei dati
Alla fine del corso, avrai la sicurezza necessaria per pulire dati di vario tipo e usare il record linkage per unire più set di dati. La pulizia dei dati è una competenza fondamentale per i data scientist. Se vuoi saperne di più sulla pulizia dei dati in Python e le sue applicazioni, dai un'occhiata ai seguenti percorsi: Data Scientist con Python e importazione e pulizia dei dati con Python.Prerequisiti
Python ToolboxJoining Data with pandas1
Common data problems
In this chapter, you'll learn how to overcome some of the most common dirty data problems. You'll convert data types, apply range constraints to remove future data points, and remove duplicated data points to avoid double-counting.
2
Text and categorical data problems
Categorical and text data can often be some of the messiest parts of a dataset due to their unstructured nature. In this chapter, you’ll learn how to fix whitespace and capitalization inconsistencies in category labels, collapse multiple categories into one, and reformat strings for consistency.
3
Advanced data problems
In this chapter, you'll dive into more advanced data cleaning problems, such as ensuring that weights are all written in kilograms instead of pounds. You'll also gain invaluable skills that will help you verify that values have been added correctly, and that missing values don't negatively impact your analyses.
4
Record linkage
Record linkage is a powerful technique used to merge multiple datasets together, used when values have typos or different spellings. In this chapter, you'll learn how to link records by calculating the similarity between strings—you'll then use your new skills to join two restaurant review datasets into one clean master dataset.
Pulizia dei dati in Python
Corso completato
Ottieni Attestato di conseguimento
Aggiungi questa certificazione al tuo profilo LinkedIn, al curriculum o al CVCondividila sui social e nella valutazione delle tue performance
Incluso conPremium or Team
Iscriviti OraUnisciti a oltre 19 milioni di studenti e inizia Pulizia dei dati in Python oggi!
Crea il tuo account gratuito
o
Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.