Chuyển đến nội dung chính
Trang chủR

Khóa học

Regular Expressions nâng cao trong R

Trung cấpTrình độ kỹ năng
Đã cập nhật tháng 11, 2024
Bắt Đầu Khóa Học Miễn Phí
RProgramming
4 gio
14 video
48 Bài tập
3,650 XP
4,743
Giấy chứng nhận Thành tích

Tạo Tài Khoản Miễn Phí

Tiếp tục với GoogleHiển thị thêm tùy chọn

hoặc


Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.

Được người học tại hàng ngàn công ty yêu thích

Group

Đào tạo một đội ngũ?

Dùng thử cho Doanh nghiệp

Mô tả khóa học

Phân tích dữ liệu dạng bảng thì rất thú vị. Nhưng nếu những điều bạn quan tâm nhất lại không nằm trong một bộ dữ liệu gọn gàng mà ở dạng văn bản thuần thì sao? Đừng lo: Trong khóa học này, bạn sẽ học mọi thứ cần biết để tạo các biểu thức chính quy mạnh mẽ, giúp bạn tìm ra toàn bộ thông tin cần cho phân tích chỉ từ một khối văn bản. Không chỉ vậy, với khái niệm khoảng cách chuỗi, bạn sẽ học cách làm việc ngay cả với văn bản có lỗi chính tả hoặc lỗi quét, vì bạn có thể nối khớp chúng với các bản ghi đúng từ nguồn dữ liệu khác (liên kết bản ghi). Là tài liệu học, chúng ta sẽ phân tích các tài liệu thực về doanh thu phòng vé tại các rạp chiếu phim ở Thụy Sĩ.

Điều kiện tiên quyết

Introduction to the TidyverseString Manipulation with stringr in R
1

Regular Expressions: Tự viết mẫu tùy chỉnh

Regular expressions có thể khá đáng ngại lúc ban đầu vì chứa rất nhiều ký tự đặc biệt. Trong chương này, bạn sẽ học cách giải mã chúng và tự viết các mẫu để tìm đúng thứ bạn cần.
Bắt Đầu Chương
2

Tạo chuỗi từ dữ liệu

Trong chương này, chúng ta sẽ tạm rời khỏi regular expressions và tập trung vào thao tác chuỗi bằng cách tạo chuỗi từ các cấu trúc dữ liệu khác như vector hoặc list.
Bắt Đầu Chương
3

Trích xuất dữ liệu có cấu trúc từ văn bản

4

Độ tương đồng giữa các chuỗi

Ở chương cuối, chúng ta sẽ chuyển hướng khỏi regular expressions để tìm hiểu về khoảng cách chuỗi. Bằng cách tính độ khác nhau giữa nhiều chuỗi, ta có thể ghép nối những chuỗi tương tự. Điều này giúp phát hiện bản trùng lặp ngay cả khi chúng có lỗi nhỏ như lỗi chính tả. Đây là phần quan trọng của liên kết bản ghi, nơi chúng ta kết hợp các bộ dữ liệu từ nhiều nguồn.
Bắt Đầu Chương
Regular Expressions nâng cao trong R
Hoàn
Thành

Nhận Giấy Chứng Nhận Hoàn Thành

Thêm chứng chỉ này vào hồ sơ LinkedIn, CV hoặc sơ yếu lý lịch của ban
Chia sẻ trên mạng xã hội và trong đánh giá hiệu suất của ban
Đăng ký ngay

Tham gia cùng hơn 19 triệu học viên và bắt đầu Regular Expressions nâng cao trong R ngay hôm nay!

Tạo Tài Khoản Miễn Phí

Tiếp tục với GoogleHiển thị thêm tùy chọn

hoặc


Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.

Phát triển kỹ năng dữ liệu với DataCamp cho thiết bị di động

Tiến bộ mọi lúc mọi nơi với các khóa học cho thiết bị di động và thử thách lập trình 5 phút hằng ngày.