Chuyển đến nội dung chính
Trang chủPython

Khóa học

Khai thác đặc trưng cho NLP bằng Python

Nâng caoTrình độ kỹ năng
Đã cập nhật tháng 11, 2024
Bắt Đầu Khóa Học Miễn Phí
PythonMachine Learning4 giờ15 video52 Bài tập4,200 XP28,942Giấy Chứng Nhận Thành Tích

Tạo tài khoản miễn phí

hoặc

Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.

Được yêu thích bởi học viên tại hàng nghìn công ty

Group

Đào tạo 2 người trở lên?

Thử DataCamp for Business

Mô tả khóa học

Trong khóa học này, bạn sẽ học các kỹ thuật giúp trích xuất thông tin hữu ích từ văn bản và xử lý chúng thành định dạng phù hợp để áp dụng các mô hình ML. Cụ thể hơn, bạn sẽ tìm hiểu về gán nhãn từ loại (POS tagging), nhận diện thực thể có tên (named entity recognition), điểm dễ đọc (readability scores), các mô hình n-gram và tf-idf, và cách triển khai chúng bằng scikit-learn và spaCy. Bạn cũng sẽ học cách tính mức độ tương đồng giữa hai tài liệu. Trong quá trình học, bạn sẽ dự đoán cảm xúc của các bài đánh giá phim và xây dựng hệ gợi ý phim và TED Talk. Sau khóa học, bạn sẽ có thể tạo ra các đặc trưng quan trọng từ bất kỳ văn bản nào và giải quyết một số bài toán thách thức nhất trong khoa học dữ liệu!

Điều kiện tiên quyết

Introduction to Natural Language Processing in PythonSupervised Learning with scikit-learn
1

Basic features and readability scores

Learn to compute basic features such as number of words, number of characters, average word length and number of special characters (such as Twitter hashtags and mentions). You will also learn to compute readability scores and determine the amount of education required to comprehend a piece of text.
Bắt Đầu Chương
2

Text preprocessing, POS tagging and NER

In this chapter, you will learn about tokenization and lemmatization. You will then learn how to perform text cleaning, part-of-speech tagging, and named entity recognition using the spaCy library. Upon mastering these concepts, you will proceed to make the Gettysburg address machine-friendly, analyze noun usage in fake news, and identify people mentioned in a TechCrunch article.
Bắt Đầu Chương
3

N-Gram models

4

TF-IDF and similarity scores

Khai thác đặc trưng cho NLP bằng Python
Hoàn
Thành

Nhận Giấy Chứng Nhận Hoàn Thành

Thêm chứng chỉ này vào hồ sơ LinkedIn, CV hoặc sơ yếu lý lịch của ban
Chia sẻ trên mạng xã hội và trong đánh giá hiệu suất của ban
Đăng Ký Ngay

Tham gia cùng hơn 19 triệu học viên và bắt đầu Khai thác đặc trưng cho NLP bằng Python ngay hôm nay!

Tạo tài khoản miễn phí

hoặc

Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.

Phát triển kỹ năng dữ liệu với DataCamp cho thiết bị di động

Tiến bộ mọi lúc mọi nơi với các khóa học cho thiết bị di động và thử thách lập trình 5 phút hằng ngày.