Przejdź do głównej treści
Strona głównaPython

Kurs

Inżynieria cech dla NLP w Pythonie

ZaawansowanyPoziom umiejętności
Zaktualizowano 11.2024
Poznaj techniki wydobywania przydatnych informacji z tekstu i przetwarzania ich do formatu odpowiedniego dla machine learning.
Zacznij kurs za darmo
PythonMachine Learning
4 godz.
15 filmów
52 Ćwiczenia
4,200 XP
29,225
Zaświadczenie o ukończeniu

Utwórz bezpłatne konto

Kontynuuj z GooglePokaż więcej opcji

lub


Kontynuując, akceptujesz nasze Warunki korzystania, naszą Politykę prywatności oraz to, że Twoje dane są przechowywane w USA.

Uwielbiany przez kursantów z tysięcy firm

Group

Szkolisz zespół?

Wypróbuj dla firm

Opis kursu

W tym kursie poznasz techniki pozwalające wyodrębniać przydatne informacje z tekstu i przekształcać je do postaci odpowiedniej dla modeli uczenia maszynowego. Nauczysz się między innymi oznaczania części mowy, rozpoznawania jednostek nazewniczych, wskaźników czytelności, modeli n-gramów i tf-idf oraz sposobów ich implementacji przy użyciu scikit-learn i spaCy. Dowiesz się też, jak mierzyć podobieństwo między dokumentami. W trakcie kursu przewidzisz wydźwięk recenzji filmowych oraz zbudujesz systemy rekomendacji filmów i wykładów TED. Po ukończeniu kursu będziesz potrafić tworzyć kluczowe cechy z dowolnego tekstu i rozwiązywać jedne z najtrudniejszych problemów w dziedzinie nauki o danych!

Wymagania wstępne

Introduction to Natural Language Processing in PythonSupervised Learning with scikit-learn
1

Basic features and readability scores

Learn to compute basic features such as number of words, number of characters, average word length and number of special characters (such as Twitter hashtags and mentions). You will also learn to compute readability scores and determine the amount of education required to comprehend a piece of text.
Zacznij rozdział
2

Text preprocessing, POS tagging and NER

In this chapter, you will learn about tokenization and lemmatization. You will then learn how to perform text cleaning, part-of-speech tagging, and named entity recognition using the spaCy library. Upon mastering these concepts, you will proceed to make the Gettysburg address machine-friendly, analyze noun usage in fake news, and identify people mentioned in a TechCrunch article.
Zacznij rozdział
Inżynieria cech dla NLP w Pythonie
Kurs
ukończony

Zdobądź zaświadczenie o ukończeniu

Dodaj to poświadczenie do swojego profilu LinkedIn, CV lub życiorysu
Udostępnij to w mediach społecznościowych i podczas oceny wyników pracy
Zapisz się teraz

Dołącz do ponad 19 milionów kursantów i zacznij Inżynieria cech dla NLP w Pythonie już dziś!

Utwórz bezpłatne konto

Kontynuuj z GooglePokaż więcej opcji

lub


Kontynuując, akceptujesz nasze Warunki korzystania, naszą Politykę prywatności oraz to, że Twoje dane są przechowywane w USA.

Rozwijaj swoje umiejętności w zakresie danych dzięki DataCamp dla urządzeń mobilnych

Rób postępy w podróży dzięki naszym kursom mobilnym i codziennym 5-minutowym wyzwaniom kodowania.