Hoppa till huvudinnehållet
HemPython

Kurs

Feature Engineering for NLP in Python

AvanceradKunskapsnivå
Uppdaterad 2024-11
Learn techniques to extract useful information from text and process them into a format suitable for machine learning.
Starta kursen gratis
PythonMachine Learning
4 tim
15 videor
52 Övningar
4,200 XP
29,233
Intyg om genomförande

Skapa ditt kostnadsfria konto

Fortsätt med GoogleVisa fler alternativ

eller


Genom att fortsätta godkänner du våra Användarvillkor, vår Integritetspolicy och att dina uppgifter lagras i USA.

Omtyckt av lärande på tusentals företag

Group

Utbildar du ett team?

Prova för företag

Kursbeskrivning

In this course, you will learn techniques that will allow you to extract useful information from text and process them into a format suitable for applying ML models. More specifically, you will learn about POS tagging, named entity recognition, readability scores, the n-gram and tf-idf models, and how to implement them using scikit-learn and spaCy. You will also learn to compute how similar two documents are to each other. In the process, you will predict the sentiment of movie reviews and build movie and Ted Talk recommenders. Following the course, you will be able to engineer critical features out of any text and solve some of the most challenging problems in data science!

Förkunskapskrav

Introduction to Natural Language Processing in PythonSupervised Learning with scikit-learn
1

Basic features and readability scores

Learn to compute basic features such as number of words, number of characters, average word length and number of special characters (such as Twitter hashtags and mentions). You will also learn to compute readability scores and determine the amount of education required to comprehend a piece of text.
Starta kapitel
2

Text preprocessing, POS tagging and NER

In this chapter, you will learn about tokenization and lemmatization. You will then learn how to perform text cleaning, part-of-speech tagging, and named entity recognition using the spaCy library. Upon mastering these concepts, you will proceed to make the Gettysburg address machine-friendly, analyze noun usage in fake news, and identify people mentioned in a TechCrunch article.
Starta kapitel
Feature Engineering for NLP in Python
Kurs
slutförd

Tjäna ett prestationsbevis

Lägg till det här beviset i din LinkedIn-profil, ditt CV eller din meritförteckning
Dela det i sociala medier och i din medarbetarutvärdering
Registrera dig nu

Gå med 19 miljoner lärande och börja Feature Engineering for NLP in Python idag!

Skapa ditt kostnadsfria konto

Fortsätt med GoogleVisa fler alternativ

eller


Genom att fortsätta godkänner du våra Användarvillkor, vår Integritetspolicy och att dina uppgifter lagras i USA.

Utveckla dina datakunskaper med DataCamp för mobilen

Gör framsteg när du är på språng med våra mobila kurser och dagliga 5-minuters kodningsutmaningar.