メインコンテンツへスキップ
ホームR

コース

Rで学ぶ中級正規表現

中級スキルレベル
更新日 2024/11
Rで正規表現と文字列距離を習得し、テキストデータの操作・分析などを実践的に身につけましょう。
コースを無料で開始
RProgramming
4時間
14 ビデオ
48 演習
3,650 XP
4,740
修了証明書

無料アカウントを作成

Googleで続行その他のオプションを表示

または


続行すると、弊社の利用規約プライバシーポリシーに同意し、データが米国に保存されることに同意したことになります。

何千もの企業の従業員が支持

Group

チームのトレーニングを担当していますか?

Businessをお試しください

コース説明

表形式のデータを分析するのは楽しいものです。でも、いちばん知りたい情報が、きれいに整ったデータセットではなくプレーンテキストでしか手に入らないとしたらどうでしょう?ご安心ください。このコースでは、テキストの塊から分析に必要な情報を見つけ出せる、強力な正規表現の作り方を一から学びます。さらに、文字列距離の考え方を使って、誤字やスキャンミスを含むテキストでも、他のデータソースの正しい候補に照合できる(レコードリンケージ)方法を学びます。学習素材としては、スイスの映画館における興行収入に関する実在の文書を分析します。

前提条件

Introduction to the TidyverseString Manipulation with stringr in R
1

Regular Expressions: Writing Custom Patterns

Regular expressions can be pretty intimidating at first as they contain vast amounts of special characters. In this chapter, you'll learn to decipher these and write your own patterns to find exactly what you're looking for.
チャプターを開始
2

Creating Strings with Data

In this chapter, we will slightly move away from regular expressions and focus on string manipulation by creating strings from other data structures like vectors or lists.
3

Extracting Structured Data From Text

4

Similarities Between Strings

In the last chapter, we will shift gears away from regular expressions to understanding string distances. By calculating the differences of multiple strings, we can match those that are similar. This will help us to find duplicates even when they contain small errors like typos. This is an important part to record linkage where we combine datasets from multiple sources.
Rで学ぶ中級正規表現
コース完了

修了証明書を取得

この修了書をLinkedInや履歴書、CVに追加しましょう
ソーシャルメディアや人事評価で共有しましょう
今すぐ登録

19百万人を超える学習者と共にRで学ぶ中級正規表現を始めましょう!

無料アカウントを作成

Googleで続行その他のオプションを表示

または


続行すると、弊社の利用規約プライバシーポリシーに同意し、データが米国に保存されることに同意したことになります。

DataCamp for Mobileでデータスキルを磨きましょう

モバイル コースと毎日の 5 分間のコーディング チャレンジで、外出先でも進歩できます。