Curs
Curățarea datelor în Python
IntermediarNivel de competențe
Actualizat 12.2025
PythonData Preparation4 h13 videoclipuri44 Exerciții3,500 XP150K+Certificat de realizare
Creează-ți contul gratuit
Continuă cu GoogleArată mai multe opțiunisau
Continuând, accepți Termenii de utilizare, Politica de confidențialitate și faptul că datele tale sunt stocate în SUA.
Îndrăgit de cursanți din mii de companii
Formare pentru o echipă?
Încearcă pentru afaceriDescrierea cursului
Descoperă cum să cureți datele în Python
Se spune adesea că oamenii de știință în domeniul datelor își petrec 80% din timp curățând și manipulând datele și doar 20% din timp analizându-le. Curățarea datelor este un pas esențial pentru orice data scientist, deoarece analiza datelor murdare poate duce la concluzii inexacte.În acest curs, vei învăța cum să identifici, să diagnostichezi și să rezolvi diverse probleme de curățare a datelor în Python, de la cele simple la cele avansate. Vei lucra cu tipuri de date necorespunzătoare, vei verifica dacă datele tale se află în intervalul corect, vei gestiona datele lipsă, vei realiza asocierea înregistrărilor și multe altele!
Învață cum să cureți diferite tipuri de date
Primul capitol al cursului explorează problemele frecvente ale datelor și cum le poți rezolva. Vei înțelege mai întâi tipurile de date de bază și cum să lucrezi cu ele individual. După aceea, vei aplica constrângeri de interval și vei elimina punctele de date duplicate.Ultimul capitol explorează legarea înregistrărilor, un instrument puternic pentru a îmbina mai multe seturi de date. Vei învăța cum să legi înregistrările calculând similaritatea dintre șiruri. În cele din urmă, vei folosi noile tale abilități pentru a uni două seturi de date cu recenzii de restaurante într-un singur set de date principal, curat.
Câștigă încredere în curățarea datelor
La finalul cursului, vei dobândi încrederea necesară pentru a curăța date din diverse tipuri și pentru a folosi record linkage pentru a îmbina mai multe seturi de date. Curățarea datelor este o abilitate esențială pentru oamenii de știință în domeniul datelor. Dacă vrei să afli mai multe despre curățarea datelor în Python și aplicațiile sale, consultă următoarele trasee: Data Scientist cu Python și Importarea și Curățarea Datelor cu Python.Cerințe prealabile
Python ToolboxJoining Data with pandas1
Common data problems
In this chapter, you'll learn how to overcome some of the most common dirty data problems. You'll convert data types, apply range constraints to remove future data points, and remove duplicated data points to avoid double-counting.
2
Text and categorical data problems
Categorical and text data can often be some of the messiest parts of a dataset due to their unstructured nature. In this chapter, you’ll learn how to fix whitespace and capitalization inconsistencies in category labels, collapse multiple categories into one, and reformat strings for consistency.
3
Advanced data problems
In this chapter, you'll dive into more advanced data cleaning problems, such as ensuring that weights are all written in kilograms instead of pounds. You'll also gain invaluable skills that will help you verify that values have been added correctly, and that missing values don't negatively impact your analyses.
4
Record linkage
Record linkage is a powerful technique used to merge multiple datasets together, used when values have typos or different spellings. In this chapter, you'll learn how to link records by calculating the similarity between strings—you'll then use your new skills to join two restaurant review datasets into one clean master dataset.
Curățarea datelor în Python
Curs finalizat
Obține diploma de absolvire
Adaugă această acreditare la profilul tău LinkedIn, CV sau rezumatDistribuie pe rețelele de socializare și în evaluarea ta de performanțăÎnscrie-te acum
Alătură-te celor peste 19 de milioane de cursanți și începe Curățarea datelor în Python astăzi!
Creează-ți contul gratuit
Continuă cu GoogleArată mai multe opțiunisau
Continuând, accepți Termenii de utilizare, Politica de confidențialitate și faptul că datele tale sunt stocate în SUA.
Dezvoltați-vă abilitățile de gestionare a datelor cu DataCamp pentru mobil
Fă progrese din mers cu cursurile noastre mobile și provocările zilnice de programare de 5 minute.