Перейти к основному содержимому
ГлавнаяPython

Курс

Feature Engineering for NLP in Python

Продвинутый уровеньУровень навыков
Обновлено 11.2024
Learn techniques to extract useful information from text and process them into a format suitable for machine learning.
Начать курс бесплатно
PythonMachine Learning
4 ч
15 видео
52 Упражнения
4,200 XP
29,225
Справка об успешном завершении

Создать бесплатный аккаунт

Продолжить через GoogleПоказать больше вариантов

или


Продолжая, вы принимаете наши Условия использования, нашу Политику конфиденциальности и соглашаетесь с тем, что ваши данные хранятся в США.

Любимая обучающимися из тысяч компаний

Group

Обучаете команду?

Попробуйте для бизнеса

Описание курса

In this course, you will learn techniques that will allow you to extract useful information from text and process them into a format suitable for applying ML models. More specifically, you will learn about POS tagging, named entity recognition, readability scores, the n-gram and tf-idf models, and how to implement them using scikit-learn and spaCy. You will also learn to compute how similar two documents are to each other. In the process, you will predict the sentiment of movie reviews and build movie and Ted Talk recommenders. Following the course, you will be able to engineer critical features out of any text and solve some of the most challenging problems in data science!

Необходимые условия

Introduction to Natural Language Processing in PythonSupervised Learning with scikit-learn
1

Basic features and readability scores

Learn to compute basic features such as number of words, number of characters, average word length and number of special characters (such as Twitter hashtags and mentions). You will also learn to compute readability scores and determine the amount of education required to comprehend a piece of text.
Начать главу
2

Text preprocessing, POS tagging and NER

In this chapter, you will learn about tokenization and lemmatization. You will then learn how to perform text cleaning, part-of-speech tagging, and named entity recognition using the spaCy library. Upon mastering these concepts, you will proceed to make the Gettysburg address machine-friendly, analyze noun usage in fake news, and identify people mentioned in a TechCrunch article.
Начать главу
4

TF-IDF and similarity scores

Feature Engineering for NLP in Python
Курс
завершён

Получить сертификат об окончании

Добавьте эту квалификацию в профиль LinkedIn, резюме или CV
Поделитесь в социальных сетях и в обзоре эффективности
Записаться сейчас

Присоединяйтесь к более чем 19 миллионам обучающихся и начните Feature Engineering for NLP in Python уже сегодня!

Создать бесплатный аккаунт

Продолжить через GoogleПоказать больше вариантов

или


Продолжая, вы принимаете наши Условия использования, нашу Политику конфиденциальности и соглашаетесь с тем, что ваши данные хранятся в США.

Развивайте свои навыки работы с данными с помощью DataCamp для мобильных устройств.

Успевайте в обучении на ходу с помощью наших мобильных курсов и ежедневных 5-минутных заданий по программированию.