Kurs
Czyszczenie danych w Pythonie
ŚredniozaawansowanyPoziom umiejętności
Zaktualizowano 12.2025
PythonData Preparation4 godz.13 filmów44 Ćwiczenia3,500 XP150K+Zaświadczenie o ukończeniu
Utwórz bezpłatne konto
Kontynuuj z GooglePokaż więcej opcjilub
Kontynuując, akceptujesz nasze Warunki korzystania, naszą Politykę prywatności oraz to, że Twoje dane są przechowywane w USA.
Uwielbiany przez kursantów z tysięcy firm
Szkolisz zespół?
Wypróbuj dla firmOpis kursu
Odkryj, jak czyścić dane w Pythonie
Powszechnie mówi się, że data scientist spędzają 80% swojego czasu na czyszczeniu i przetwarzaniu danych, a tylko 20% na ich analizie. Czyszczenie danych to niezbędny etap pracy każdego data scientist, ponieważ analiza nieczystych danych może prowadzić do błędnych wniosków.W tym kursie nauczysz się, jak identyfikować, diagnozować i rozwiązywać różne problemy związane z czyszczeniem danych w Pythonie, od prostych po zaawansowane. Będziesz pracować z nieprawidłowymi typami danych, sprawdzać, czy dane mieszczą się w prawidłowym zakresie, obsługiwać brakujące dane, wykonywać łączenie rekordów i nie tylko!
Dowiedz się, jak czyścić różne typy danych
Pierwszy rozdział kursu omawia najczęstsze problemy z danymi i sposoby ich naprawy. Najpierw poznasz podstawowe typy danych i nauczysz się, jak pracować z każdym z nich osobno. Następnie zastosujesz ograniczenia zakresu i usuniesz zduplikowane punkty danych.Ostatni rozdział omawia łączenie rekordów, potężne narzędzie do scalania wielu zbiorów danych. Nauczysz się, jak łączyć rekordy, obliczając podobieństwo między ciągami znaków. Na koniec wykorzystasz nowe umiejętności, aby połączyć dwa zbiory danych z recenzjami restauracji w jeden czysty główny zbiór danych.
Zdobądź pewność w czyszczeniu danych
Po ukończeniu kursu zyskasz pewność w czyszczeniu danych różnych typów oraz wykorzystaniu łączenia rekordów do scalania wielu zbiorów danych. Czyszczenie danych to podstawowa umiejętność dla data scientistów. Jeśli chcesz dowiedzieć się więcej o czyszczeniu danych w Pythonie i jego zastosowaniach, sprawdź poniższe ścieżki: Data Scientist z Pythonem oraz Importowanie i czyszczenie danych z Pythonem.Wymagania wstępne
Python ToolboxJoining Data with pandas1
Common data problems
In this chapter, you'll learn how to overcome some of the most common dirty data problems. You'll convert data types, apply range constraints to remove future data points, and remove duplicated data points to avoid double-counting.
2
Text and categorical data problems
Categorical and text data can often be some of the messiest parts of a dataset due to their unstructured nature. In this chapter, you’ll learn how to fix whitespace and capitalization inconsistencies in category labels, collapse multiple categories into one, and reformat strings for consistency.
3
Advanced data problems
In this chapter, you'll dive into more advanced data cleaning problems, such as ensuring that weights are all written in kilograms instead of pounds. You'll also gain invaluable skills that will help you verify that values have been added correctly, and that missing values don't negatively impact your analyses.
4
Record linkage
Record linkage is a powerful technique used to merge multiple datasets together, used when values have typos or different spellings. In this chapter, you'll learn how to link records by calculating the similarity between strings—you'll then use your new skills to join two restaurant review datasets into one clean master dataset.
Czyszczenie danych w Pythonie
Kurs ukończony
Zdobądź zaświadczenie o ukończeniu
Dodaj to poświadczenie do swojego profilu LinkedIn, CV lub życiorysuUdostępnij to w mediach społecznościowych i podczas oceny wyników pracyZapisz się teraz
Dołącz do ponad 19 milionów kursantów i zacznij Czyszczenie danych w Pythonie już dziś!
Utwórz bezpłatne konto
Kontynuuj z GooglePokaż więcej opcjilub
Kontynuując, akceptujesz nasze Warunki korzystania, naszą Politykę prywatności oraz to, że Twoje dane są przechowywane w USA.
Rozwijaj swoje umiejętności w zakresie danych dzięki DataCamp dla urządzeń mobilnych
Rób postępy w podróży dzięki naszym kursom mobilnym i codziennym 5-minutowym wyzwaniom kodowania.