Accéder au contenu principal
AccueilR

Cours

Expressions régulières intermédiaires en R

IntermédiaireNiveau de compétence
Actualisé 11/2024
Manipulez des données textuelles, analysez-les et bien plus en maîtrisant les expressions régulières et les distances entre chaînes dans R.
Commencer Le Cours Gratuitement
RProgramming4 h14 vidéos48 Exercices3,650 XP4,693Certificat de réussite.

Créez votre compte gratuit

ou

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.

Apprécié par des utilisateurs provenant de milliers d'entreprises

Group

Former 2 personnes ou plus ?

Essayez DataCamp for Business

Description du cours

Analyser des données sous forme de tableaux, c’est agréable. Mais que faire si ce qui vous intéresse le plus ne se présente pas comme un jeu de données bien structuré, mais sous forme de texte brut ? Pas de panique : dans ce cours, vous apprendrez tout ce qu’il faut pour créer des expressions régulières puissantes qui vous permettront de retrouver toutes les informations nécessaires à vos analyses à partir d’un simple bloc de texte. Et ce n’est pas tout. Grâce au concept de distance entre chaînes, vous apprendrez à travailler avec du texte contenant des fautes de frappe ou des erreurs de numérisation, en pouvant les faire correspondre à leurs équivalents corrects issus d’autres sources de données (rattachement d’enregistrements). Comme support d’apprentissage, nous analyserons de vrais documents sur les chiffres du box-office dans les cinémas suisses.

Prérequis

Introduction to the TidyverseString Manipulation with stringr in R
1

Regular Expressions: Writing Custom Patterns

Regular expressions can be pretty intimidating at first as they contain vast amounts of special characters. In this chapter, you'll learn to decipher these and write your own patterns to find exactly what you're looking for.
Commencer Le Chapitre
2

Creating Strings with Data

3

Extracting Structured Data From Text

4

Similarities Between Strings

In the last chapter, we will shift gears away from regular expressions to understanding string distances. By calculating the differences of multiple strings, we can match those that are similar. This will help us to find duplicates even when they contain small errors like typos. This is an important part to record linkage where we combine datasets from multiple sources.
Commencer Le Chapitre
Expressions régulières intermédiaires en R
Cours
terminé

Obtenez un certificat de réussite

Ajoutez cette certification à votre profil LinkedIn, à votre CV ou à votre portfolio
Partagez-la sur les réseaux sociaux et dans votre évaluation de performance
S'inscrire Maintenant

Rejoignez plus de 19 millions d'utilisateurs et commencez Expressions régulières intermédiaires en R dès aujourd'hui !

Créez votre compte gratuit

ou

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.

Apprenez où que vous soyez avec l'application DataCamp

Progressez où que vous soyez grâce à nos cours conçus pour mobile et à nos défis quotidiens de 5 minutes.