Ga naar hoofdinhoud
HomeR

Cursus

Gevorderde reguliere expressies in R

GemiddeldVaardigheidsniveau
Bijgewerkt 11-2024
Speel met tekstgegevens, analyseer ze en doe nog veel meer door regelmatige uitdrukkingen en stringafstanden in R onder de knie te krijgen.
Start Cursus Kosteloos
RProgramming
4 u
14 videos
48 Opdrachten
3,650 XP
4,743
Bewijs van Prestatie

Maak je kosteloos account aan

Ga verder met GoogleMeer opties weergeven

of


Door verder te gaan accepteer je onze Gebruiksvoorwaarden, ons Privacybeleid en dat je gegevens worden opgeslagen in de VS.

Geliefd bij leerlingen van duizenden bedrijven

Group

Een team trainen?

Probeer voor bedrijven

Cursusbeschrijving

Gegevens analyseren die in tabellen staan is leuk. Maar wat als de dingen die we het interessantst vinden niet beschikbaar zijn als een netjes georganiseerde gegevensset, maar als platte tekst? Geen paniek: in deze cursus leer je alles wat je moet weten om krachtige reguliere expressies te maken waarmee je alle informatie kunt vinden die je nodig hebt voor je analyses, gewoon uit een lap tekst. En dat is niet alles. Met het concept van tekenreeksafstanden leer je ook werken met tekst die typefouten of scanfouten bevat, omdat je die kunt koppelen aan de juiste tegenhangers uit andere databronnen (record linkage). Als oefenmateriaal analyseren we echte documenten over box office-cijfers in Zwitserse bioscopen.

Vereisten

Introduction to the TidyverseString Manipulation with stringr in R
1

Reguliere expressies: eigen patronen schrijven

Reguliere expressies kunnen in het begin best intimiderend zijn, omdat ze vol staan met speciale tekens. In dit hoofdstuk leer je die te ontcijferen en je eigen patronen te schrijven om precies te vinden wat je zoekt.
Hoofdstuk beginnen
2

Tekenreeksen maken met data

In dit hoofdstuk stappen we even weg van reguliere expressies en richten we ons op tekenreeksmanipulatie door tekenreeksen te maken uit andere datastructuren zoals vectoren of lijsten.
Hoofdstuk beginnen
3

Gestructureerde data uit tekst halen

4

Overeenkomsten tussen tekenreeksen

In het laatste hoofdstuk schakelen we over van reguliere expressies naar het begrijpen van tekenreeksafstanden. Door de verschillen tussen meerdere tekenreeksen te berekenen, kunnen we degene koppelen die op elkaar lijken. Zo vinden we duplicaten, zelfs als ze kleine fouten zoals typefouten bevatten. Dit is een belangrijk onderdeel van record linkage, waarbij we gegevenssets uit meerdere bronnen combineren.
Hoofdstuk beginnen
Gevorderde reguliere expressies in R
Cursus
voltooid

Verdien een prestatieverklaring

Voeg deze referentie toe aan je LinkedIn-profiel, cv of curriculum vitae
Deel het op sociale media en in je functioneringsgesprek
Schrijf je nu in

Sluit je aan bij meer dan 19 miljoen leerlingen en start vandaag nog met Gevorderde reguliere expressies in R!

Maak je kosteloos account aan

Ga verder met GoogleMeer opties weergeven

of


Door verder te gaan accepteer je onze Gebruiksvoorwaarden, ons Privacybeleid en dat je gegevens worden opgeslagen in de VS.

Ontwikkel je datavaardigheden met DataCamp voor Mobiel

Maak vooruitgang onderweg met onze mobiele cursussen en dagelijkse 5-minuten programmeeruitdagingen.