Ga naar hoofdinhoud
HomePython

Cursus

Feature Engineering voor NLP in Python

GevorderdVaardigheidsniveau
Bijgewerkt 11-2024
Leer manieren om nuttige info uit tekst te halen en deze om te zetten naar een formaat dat geschikt is voor machine learning.
Start Cursus Kosteloos
PythonMachine Learning4 u15 videos52 Opdrachten4,200 XP28,942Prestatieverklaring

Maak je gratis account aan

of

Door verder te gaan accepteer je onze Gebruiksvoorwaarden, ons Privacybeleid en dat je gegevens worden opgeslagen in de VS.

Geliefd bij leerlingen van duizenden bedrijven

Group

Wil je 2 of meer mensen trainen?

Probeer DataCamp for Business

Cursusbeschrijving

In deze cursus leer je technieken om nuttige informatie uit tekst te halen en die te verwerken naar een formaat dat geschikt is voor ML-modellen. Je leert onder andere over POS-tagging, named entity recognition, leesbaarheidscores, n-gram- en tf-idf-modellen, en hoe je deze implementeert met scikit-learn en spaCy. Ook leer je berekenen hoe sterk twee documenten op elkaar lijken. Onderweg voorspel je het sentiment van filmrecensies en bouw je aanbevelers voor films en TED Talks. Na afloop kun je uit elke tekst cruciale features halen en enkele van de meest uitdagende problemen in data science oplossen!

Vereisten

Introduction to Natural Language Processing in PythonSupervised Learning with scikit-learn
1

Basic features and readability scores

Learn to compute basic features such as number of words, number of characters, average word length and number of special characters (such as Twitter hashtags and mentions). You will also learn to compute readability scores and determine the amount of education required to comprehend a piece of text.
Hoofdstuk Beginnen
2

Text preprocessing, POS tagging and NER

In this chapter, you will learn about tokenization and lemmatization. You will then learn how to perform text cleaning, part-of-speech tagging, and named entity recognition using the spaCy library. Upon mastering these concepts, you will proceed to make the Gettysburg address machine-friendly, analyze noun usage in fake news, and identify people mentioned in a TechCrunch article.
Hoofdstuk Beginnen
3

N-Gram models

4

TF-IDF and similarity scores

Feature Engineering voor NLP in Python
Cursus
voltooid

Verdien een prestatieverklaring

Voeg deze referentie toe aan je LinkedIn-profiel, cv of curriculum vitae
Deel het op sociale media en in je functioneringsgesprek
Schrijf Je Nu in

Sluit je aan bij meer dan 19 miljoen leerlingen en start vandaag nog met Feature Engineering voor NLP in Python!

Maak je gratis account aan

of

Door verder te gaan accepteer je onze Gebruiksvoorwaarden, ons Privacybeleid en dat je gegevens worden opgeslagen in de VS.

Ontwikkel je datavaardigheden met DataCamp voor Mobiel

Maak vooruitgang onderweg met onze mobiele cursussen en dagelijkse 5-minuten programmeeruitdagingen.