Chuyển đến nội dung chính
Trang chủPython

Khóa học

Khai thác đặc trưng cho NLP bằng Python

Nâng caoTrình độ kỹ năng
Đã cập nhật tháng 11, 2024
Bắt Đầu Khóa Học Miễn Phí
PythonMachine Learning
4 gio
15 video
52 Bài tập
4,200 XP
29,264
Giấy chứng nhận Thành tích

Tạo Tài Khoản Miễn Phí

Tiếp tục với GoogleHiển thị thêm tùy chọn

hoặc


Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.

Được người học tại hàng ngàn công ty yêu thích

Group

Đào tạo một đội ngũ?

Dùng thử cho Doanh nghiệp

Mô tả khóa học

Trong khóa học này, bạn sẽ học các kỹ thuật giúp trích xuất thông tin hữu ích từ văn bản và xử lý chúng thành định dạng phù hợp để áp dụng các mô hình ML. Cụ thể hơn, bạn sẽ tìm hiểu về gán nhãn từ loại (POS tagging), nhận diện thực thể có tên (named entity recognition), điểm dễ đọc (readability scores), các mô hình n-gram và tf-idf, và cách triển khai chúng bằng scikit-learn và spaCy. Bạn cũng sẽ học cách tính mức độ tương đồng giữa hai tài liệu. Trong quá trình học, bạn sẽ dự đoán cảm xúc của các bài đánh giá phim và xây dựng hệ gợi ý phim và TED Talk. Sau khóa học, bạn sẽ có thể tạo ra các đặc trưng quan trọng từ bất kỳ văn bản nào và giải quyết một số bài toán thách thức nhất trong khoa học dữ liệu!

Điều kiện tiên quyết

Introduction to Natural Language Processing in PythonSupervised Learning with scikit-learn
1

Đặc trưng cơ bản và điểm dễ đọc

Học cách tính các đặc trưng cơ bản như số lượng từ, số ký tự, độ dài trung bình của từ và số ký tự đặc biệt (như hashtag và mention trên Twitter). Bạn cũng sẽ học cách tính điểm dễ đọc và xác định mức độ học vấn cần thiết để hiểu một đoạn văn bản.
Bắt Đầu Chương
2

Tiền xử lý văn bản, gán nhãn từ loại và NER

Trong chương này, bạn sẽ học về tokenization và lemmatization. Tiếp đó, bạn sẽ học cách làm sạch văn bản, gán nhãn từ loại (part-of-speech tagging) và nhận diện thực thể có tên (named entity recognition) bằng thư viện spaCy. Sau khi nắm vững các khái niệm này, bạn sẽ chuyển bài diễn văn Gettysburg sang dạng thân thiện với máy, phân tích cách dùng danh từ trong tin giả, và xác định những người được nhắc đến trong một bài viết của TechCrunch.
Bắt Đầu Chương
Khai thác đặc trưng cho NLP bằng Python
Hoàn
Thành

Nhận Giấy Chứng Nhận Hoàn Thành

Thêm chứng chỉ này vào hồ sơ LinkedIn, CV hoặc sơ yếu lý lịch của ban
Chia sẻ trên mạng xã hội và trong đánh giá hiệu suất của ban
Đăng ký ngay

Tham gia cùng hơn 19 triệu học viên và bắt đầu Khai thác đặc trưng cho NLP bằng Python ngay hôm nay!

Tạo Tài Khoản Miễn Phí

Tiếp tục với GoogleHiển thị thêm tùy chọn

hoặc


Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.

Phát triển kỹ năng dữ liệu với DataCamp cho thiết bị di động

Tiến bộ mọi lúc mọi nơi với các khóa học cho thiết bị di động và thử thách lập trình 5 phút hằng ngày.