Sari la conținutul principal
AcasăR

course

Intermediate Regular Expressions in R

IntermediarNivel de calificare
Actualizat 11.2024
Manipulate text data, analyze it and more by mastering regular expressions and string distances in R.
Începeți Cursul Gratuit
RProgramming
4 oră
14 videos
48 exercises
3,650 XP
4,717
Declarație de realizare

Creează-ți contul gratuit

sau

Continuând, acceptați Termenii și condițiile de utilizare, Politica de confidențialitate și faptul că datele dvs. sunt stocate în SUA.

Îndrăgit de cursanți din mii de companii

Group

Training a Team?

Try for Business

Descrierea cursului

Analyzing data that comes in tables is fun. But what if the things that we find most interesting are not available as a neatly organized dataset but in plain text? Do not despair: In this course, you'll learn everything you need to know to create powerful regular expressions that will help you find all the information you need for your analyses from just a blob of text. But not only that. Using the concept of string distances, you will learn to work even with text that contains typos or scanning errors, as you will be able to match them to their correct counterparts from other data sources (record linkage). As a learning material, we will analyze real documents about box office figures in Swiss cinemas.

Cerințe preliminare

Introduction to the TidyverseString Manipulation with stringr in R
1

Regular Expressions: Writing Custom Patterns

Regular expressions can be pretty intimidating at first as they contain vast amounts of special characters. In this chapter, you'll learn to decipher these and write your own patterns to find exactly what you're looking for.
Începeți Capitolul
2

Creating Strings with Data

In this chapter, we will slightly move away from regular expressions and focus on string manipulation by creating strings from other data structures like vectors or lists.
Începeți Capitolul
3

Extracting Structured Data From Text

4

Similarities Between Strings

In the last chapter, we will shift gears away from regular expressions to understanding string distances. By calculating the differences of multiple strings, we can match those that are similar. This will help us to find duplicates even when they contain small errors like typos. This is an important part to record linkage where we combine datasets from multiple sources.
Începeți Capitolul
Intermediate Regular Expressions in R
Curs
finalizat

Obțineți o Declarație de Realizări

Adaugă aceste acreditări la profilul, CV-ul sau profilul tău LinkedIn
Distribuie-l pe rețelele sociale și în evaluarea performanței tale
Înscrie-te Acum

Alătură-te 19 milioane de cursanți și începe Intermediate Regular Expressions in R chiar azi!

Creează-ți contul gratuit

sau

Continuând, acceptați Termenii și condițiile de utilizare, Politica de confidențialitate și faptul că datele dvs. sunt stocate în SUA.

Dezvoltați-vă abilitățile de gestionare a datelor cu DataCamp pentru mobil

Fă progrese din mers cu cursurile noastre mobile și provocările zilnice de programare de 5 minute.