Khóa học
Nhập môn Xử lý Ngôn ngữ Tự nhiên với R
Trung cấpTrình độ kỹ năng
Đã cập nhật tháng 05, 2024
RMachine Learning4 gio15 video47 Bài tập3,750 XP8,548Giấy chứng nhận Thành tích
Tạo Tài Khoản Miễn Phí
Tiếp tục với GoogleHiển thị thêm tùy chọnhoặc
Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.
Được người học tại hàng ngàn công ty yêu thích
Đào tạo một đội ngũ?
Dùng thử cho Doanh nghiệpMô tả khóa học
Điều kiện tiên quyết
Intermediate RIntroduction to the Tidyverse1
Những nền tảng cốt lõi
Chương 1 của Nhập môn Xử lý Ngôn ngữ Tự nhiên chuẩn bị cho bạn chạy phân tích văn bản đầu tiên. Bạn sẽ khám phá regular expressions và tokenization, hai thành phần phổ biến nhất trong hầu hết các tác vụ phân tích. Với regular expressions, bạn có thể tìm kiếm bất kỳ mẫu nào bạn nghĩ đến; còn với tokenization, bạn có thể chuẩn bị và làm sạch văn bản cho các phân tích nâng cao hơn. Chương này là bước đệm cần thiết để xử lý các kỹ thuật mà chúng ta sẽ học ở những chương tiếp theo của khóa học.
2
Biểu diễn văn bản
Trong chương này, bạn sẽ học các cách phân tích văn bản phổ biến và được nghiên cứu nhiều nhất. Bạn sẽ xem cách tạo một text corpus, mở rộng biểu diễn bag-of-words thành ma trận TFIDF, và dùng thước đo cosine-similarity để xác định mức độ tương đồng giữa hai đoạn văn bản. Bạn sẽ củng cố nền tảng để thực hành NLP trước khi đi sâu vào các ứng dụng của NLP ở chương 3 và 4.
3
Ứng dụng: Phân loại và Topic Modeling
Chương 3 tập trung vào hai cách tiếp cận phân tích văn bản phổ biến: mô hình phân loại và topic modeling. Nếu bạn làm việc với các dự án phân tích văn bản, bạn gần như chắc chắn sẽ dùng một hoặc cả hai phương pháp này. Chương này hướng dẫn bạn cách thực hiện cả hai kỹ thuật và cung cấp góc nhìn thực tiễn về cách tiếp cận chúng.
4
Kỹ thuật nâng cao
Ở chương 4, chúng ta tìm hiểu hai trụ cột của xử lý ngôn ngữ tự nhiên: sentiment analysis và word embeddings. Đây là hai kỹ thuật phân tích mà bất kỳ ai học nền tảng phân tích văn bản cũng nên biết. Bên cạnh đó, bạn sẽ lướt qua BERT, gán nhãn từ loại (part-of-speech tagging), và named entity recognition. Gần 15 kỹ thuật phân tích khác nhau đã được đề cập trong khóa học, vì vậy chương 4 sẽ kết thúc bằng phần tổng kết lại tất cả các kỹ thuật hữu ích mà bạn sẽ học trong khóa này.
Nhập môn Xử lý Ngôn ngữ Tự nhiên với R
Hoàn Thành
Nhận Giấy Chứng Nhận Hoàn Thành
Thêm chứng chỉ này vào hồ sơ LinkedIn, CV hoặc sơ yếu lý lịch của banChia sẻ trên mạng xã hội và trong đánh giá hiệu suất của banĐăng ký ngay
Tham gia cùng hơn 19 triệu học viên và bắt đầu Nhập môn Xử lý Ngôn ngữ Tự nhiên với R ngay hôm nay!
Tạo Tài Khoản Miễn Phí
Tiếp tục với GoogleHiển thị thêm tùy chọnhoặc
Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.
Phát triển kỹ năng dữ liệu với DataCamp cho thiết bị di động
Tiến bộ mọi lúc mọi nơi với các khóa học cho thiết bị di động và thử thách lập trình 5 phút hằng ngày.