Sariți la conținutul principal
AcasăPython

Curs

Curățarea datelor în Python

IntermediarNivel de competențe
Actualizat 12.2025
Învață să diagnostichezi și să tratezi datele murdare și dezvoltă abilitățile necesare pentru a transforma datele brute în informații exacte!
Începe cursul gratuit
PythonData Preparation
4 h
13 videoclipuri
44 Exerciții
3,500 XP
150K+
Certificat de realizare

Creează-ți contul gratuit

Continuă cu GoogleArată mai multe opțiuni

sau


Continuând, accepți Termenii de utilizare, Politica de confidențialitate și faptul că datele tale sunt stocate în SUA.

Îndrăgit de cursanți din mii de companii

Group

Formare pentru o echipă?

Încearcă pentru afaceri

Descrierea cursului

Descoperă cum să cureți datele în Python

Se spune adesea că oamenii de știință în domeniul datelor își petrec 80% din timp curățând și manipulând datele și doar 20% din timp analizându-le. Curățarea datelor este un pas esențial pentru orice data scientist, deoarece analiza datelor murdare poate duce la concluzii inexacte.

În acest curs, vei învăța cum să identifici, să diagnostichezi și să rezolvi diverse probleme de curățare a datelor în Python, de la cele simple la cele avansate. Vei lucra cu tipuri de date necorespunzătoare, vei verifica dacă datele tale se află în intervalul corect, vei gestiona datele lipsă, vei realiza asocierea înregistrărilor și multe altele!

Învață cum să cureți diferite tipuri de date

Primul capitol al cursului explorează problemele frecvente ale datelor și cum le poți rezolva. Vei înțelege mai întâi tipurile de date de bază și cum să lucrezi cu ele individual. După aceea, vei aplica constrângeri de interval și vei elimina punctele de date duplicate.

Ultimul capitol explorează legarea înregistrărilor, un instrument puternic pentru a îmbina mai multe seturi de date. Vei învăța cum să legi înregistrările calculând similaritatea dintre șiruri. În cele din urmă, vei folosi noile tale abilități pentru a uni două seturi de date cu recenzii de restaurante într-un singur set de date principal, curat.

Câștigă încredere în curățarea datelor

La finalul cursului, vei dobândi încrederea necesară pentru a curăța date din diverse tipuri și pentru a folosi record linkage pentru a îmbina mai multe seturi de date. Curățarea datelor este o abilitate esențială pentru oamenii de știință în domeniul datelor. Dacă vrei să afli mai multe despre curățarea datelor în Python și aplicațiile sale, consultă următoarele trasee: Data Scientist cu Python și Importarea și Curățarea Datelor cu Python.

Cerințe prealabile

Python ToolboxJoining Data with pandas
1

Common data problems

In this chapter, you'll learn how to overcome some of the most common dirty data problems. You'll convert data types, apply range constraints to remove future data points, and remove duplicated data points to avoid double-counting.
Începe capitolul
2

Text and categorical data problems

Categorical and text data can often be some of the messiest parts of a dataset due to their unstructured nature. In this chapter, you’ll learn how to fix whitespace and capitalization inconsistencies in category labels, collapse multiple categories into one, and reformat strings for consistency.
Începe capitolul
3

Advanced data problems

In this chapter, you'll dive into more advanced data cleaning problems, such as ensuring that weights are all written in kilograms instead of pounds. You'll also gain invaluable skills that will help you verify that values have been added correctly, and that missing values don't negatively impact your analyses.
Începe capitolul
4

Record linkage

Record linkage is a powerful technique used to merge multiple datasets together, used when values have typos or different spellings. In this chapter, you'll learn how to link records by calculating the similarity between strings—you'll then use your new skills to join two restaurant review datasets into one clean master dataset.
Începe capitolul
Curățarea datelor în Python
Curs
finalizat

Obține diploma de absolvire

Adaugă această acreditare la profilul tău LinkedIn, CV sau rezumat
Distribuie pe rețelele de socializare și în evaluarea ta de performanță
Înscrie-te acum

Alătură-te celor peste 19 de milioane de cursanți și începe Curățarea datelor în Python astăzi!

Creează-ți contul gratuit

Continuă cu GoogleArată mai multe opțiuni

sau


Continuând, accepți Termenii de utilizare, Politica de confidențialitate și faptul că datele tale sunt stocate în SUA.

Dezvoltați-vă abilitățile de gestionare a datelor cu DataCamp pentru mobil

Fă progrese din mers cu cursurile noastre mobile și provocările zilnice de programare de 5 minute.