Przejdź do głównej treści
Strona głównaPython

Kurs

Czyszczenie danych w Pythonie

ŚredniozaawansowanyPoziom umiejętności
Zaktualizowano 12.2025
Naucz się diagnozować i naprawiać brudne dane oraz zdobyj umiejętności potrzebne do przekształcania surowych danych w trafne wnioski!
Zacznij kurs za darmo
PythonData Preparation
4 godz.
13 filmów
44 Ćwiczenia
3,500 XP
150K+
Zaświadczenie o ukończeniu

Utwórz bezpłatne konto

Kontynuuj z GooglePokaż więcej opcji

lub


Kontynuując, akceptujesz nasze Warunki korzystania, naszą Politykę prywatności oraz to, że Twoje dane są przechowywane w USA.

Uwielbiany przez kursantów z tysięcy firm

Group

Szkolisz zespół?

Wypróbuj dla firm

Opis kursu

Odkryj, jak czyścić dane w Pythonie

Powszechnie mówi się, że data scientist spędzają 80% swojego czasu na czyszczeniu i przetwarzaniu danych, a tylko 20% na ich analizie. Czyszczenie danych to niezbędny etap pracy każdego data scientist, ponieważ analiza nieczystych danych może prowadzić do błędnych wniosków.

W tym kursie nauczysz się, jak identyfikować, diagnozować i rozwiązywać różne problemy związane z czyszczeniem danych w Pythonie, od prostych po zaawansowane. Będziesz pracować z nieprawidłowymi typami danych, sprawdzać, czy dane mieszczą się w prawidłowym zakresie, obsługiwać brakujące dane, wykonywać łączenie rekordów i nie tylko!

Dowiedz się, jak czyścić różne typy danych

Pierwszy rozdział kursu omawia najczęstsze problemy z danymi i sposoby ich naprawy. Najpierw poznasz podstawowe typy danych i nauczysz się, jak pracować z każdym z nich osobno. Następnie zastosujesz ograniczenia zakresu i usuniesz zduplikowane punkty danych.

Ostatni rozdział omawia łączenie rekordów, potężne narzędzie do scalania wielu zbiorów danych. Nauczysz się, jak łączyć rekordy, obliczając podobieństwo między ciągami znaków. Na koniec wykorzystasz nowe umiejętności, aby połączyć dwa zbiory danych z recenzjami restauracji w jeden czysty główny zbiór danych.

Zdobądź pewność w czyszczeniu danych

Po ukończeniu kursu zyskasz pewność w czyszczeniu danych różnych typów oraz wykorzystaniu łączenia rekordów do scalania wielu zbiorów danych. Czyszczenie danych to podstawowa umiejętność dla data scientistów. Jeśli chcesz dowiedzieć się więcej o czyszczeniu danych w Pythonie i jego zastosowaniach, sprawdź poniższe ścieżki: Data Scientist z Pythonem oraz Importowanie i czyszczenie danych z Pythonem.

Wymagania wstępne

Python ToolboxJoining Data with pandas
1

Common data problems

In this chapter, you'll learn how to overcome some of the most common dirty data problems. You'll convert data types, apply range constraints to remove future data points, and remove duplicated data points to avoid double-counting.
Zacznij rozdział
2

Text and categorical data problems

Categorical and text data can often be some of the messiest parts of a dataset due to their unstructured nature. In this chapter, you’ll learn how to fix whitespace and capitalization inconsistencies in category labels, collapse multiple categories into one, and reformat strings for consistency.
Zacznij rozdział
3

Advanced data problems

In this chapter, you'll dive into more advanced data cleaning problems, such as ensuring that weights are all written in kilograms instead of pounds. You'll also gain invaluable skills that will help you verify that values have been added correctly, and that missing values don't negatively impact your analyses.
Zacznij rozdział
4

Record linkage

Record linkage is a powerful technique used to merge multiple datasets together, used when values have typos or different spellings. In this chapter, you'll learn how to link records by calculating the similarity between strings—you'll then use your new skills to join two restaurant review datasets into one clean master dataset.
Zacznij rozdział
Czyszczenie danych w Pythonie
Kurs
ukończony

Zdobądź zaświadczenie o ukończeniu

Dodaj to poświadczenie do swojego profilu LinkedIn, CV lub życiorysu
Udostępnij to w mediach społecznościowych i podczas oceny wyników pracy
Zapisz się teraz

Dołącz do ponad 19 milionów kursantów i zacznij Czyszczenie danych w Pythonie już dziś!

Utwórz bezpłatne konto

Kontynuuj z GooglePokaż więcej opcji

lub


Kontynuując, akceptujesz nasze Warunki korzystania, naszą Politykę prywatności oraz to, że Twoje dane są przechowywane w USA.

Rozwijaj swoje umiejętności w zakresie danych dzięki DataCamp dla urządzeń mobilnych

Rób postępy w podróży dzięki naszym kursom mobilnym i codziennym 5-minutowym wyzwaniom kodowania.