Cursus
Data opschonen in R
GemiddeldVaardigheidsniveau
Bijgewerkt 08-2024Start Cursus Kosteloos
Inbegrepen bijPremium or Teams
RData Preparation4 u13 videos44 Opdrachten3,700 XP59,962Prestatieverklaring
Maak je gratis account aan
of
Door verder te gaan accepteer je onze Gebruiksvoorwaarden, ons Privacybeleid en dat je gegevens worden opgeslagen in de VS.Geliefd bij leerlingen van duizenden bedrijven
Wil je 2 of meer mensen trainen?
Probeer DataCamp for BusinessCursusbeschrijving
Overwin veelvoorkomende gegevensproblemen, zoals het verwijderen van dubbele gegevens in R
Er wordt vaak gezegd dat datawetenschappers 80% van hun tijd besteden aan het opschonen en bewerken van data en maar 20% aan het analyseren ervan. De tijd die je besteedt aan het opschonen is superbelangrijk, want als je rommelige data analyseert, kun je verkeerde conclusies trekken.In deze cursus leer je allerlei technieken om vieze data op te schonen met R. Je begint met het omzetten van datatypes, het toepassen van bereikbeperkingen en het omgaan met volledige en gedeeltelijke duplicaten om dubbeltellingen te voorkomen.
Duik in geavanceerde uitdagingen op het gebied van data
Als je eenmaal hebt geoefend met veelvoorkomende gegevensproblemen, ga je verder met moeilijkere uitdagingen, zoals zorgen dat metingen consistent zijn en omgaan met ontbrekende gegevens. Na elk nieuw concept krijg je de kans om een praktische oefening te doen om je kennis te versterken en ervaring op te doen.Leer hoe je recordkoppeling kunt gebruiken tijdens het opschonen van gegevens
Record Linkage wordt gebruikt om datasets samen te voegen als er problemen zijn met de waarden, zoals typefouten of verschillende spellingen. In het laatste hoofdstuk ga je deze handige techniek bekijken en oefenen hoe je het kunt gebruiken om twee datasets met restaurantrecensies samen te voegen tot één dataset.Vereisten
Joining Data with dplyr1
Common Data Problems
In this chapter, you'll learn how to overcome some of the most common dirty data problems. You'll convert data types, apply range constraints to remove future data points, and remove duplicated data points to avoid double-counting.
2
Categorical and Text Data
Categorical and text data can often be some of the messiest parts of a dataset due to their unstructured nature. In this chapter, you’ll learn how to fix whitespace and capitalization inconsistencies in category labels, collapse multiple categories into one, and reformat strings for consistency.
3
Advanced Data Problems
In this chapter, you’ll dive into more advanced data cleaning problems, such as ensuring that weights are all written in kilograms instead of pounds. You’ll also gain invaluable skills that will help you verify that values have been added correctly and that missing values don’t negatively impact your analyses.
4
Record Linkage
Record linkage is a powerful technique used to merge multiple datasets together, used when values have typos or different spellings. In this chapter, you'll learn how to link records by calculating the similarity between strings—you’ll then use your new skills to join two restaurant review datasets into one clean master dataset.
Data opschonen in R
Cursus voltooid
Verdien een prestatieverklaring
Voeg deze referentie toe aan je LinkedIn-profiel, cv of curriculum vitaeDeel het op sociale media en in je functioneringsgesprek
Inbegrepen bijPremium or Teams
Schrijf Je Nu inSluit je aan bij meer dan 19 miljoen leerlingen en start vandaag nog met Data opschonen in R!
Maak je gratis account aan
of
Door verder te gaan accepteer je onze Gebruiksvoorwaarden, ons Privacybeleid en dat je gegevens worden opgeslagen in de VS.