Accéder au contenu principal
AccueilPython

Cours

Feature Engineering pour le NLP en Python

AvancéNiveau de compétence
Actualisé 11/2024
Apprenez les techniques permettant d'extraire des informations utiles à partir de textes et de les traiter dans un format adapté à l'apprentissage automatique.
Commencer le cours gratuitement
PythonMachine Learning
4 h
15 vidéos
52 Exercices
4,200 XP
29,246
Certificat de formation

Créez votre compte gratuitement

Continuer avec GoogleAfficher plus d’options

ou


En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.

Apprécié par des utilisateurs provenant de milliers d'entreprises

Group

Former une équipe ?

Essayez pour les entreprises

Description du cours

Dans ce cours, vous apprendrez des techniques pour extraire des informations utiles d’un texte et les transformer dans un format adapté à l’application de modèles de ML. Plus précisément, vous verrez le POS tagging, la reconnaissance d’entités nommées, les scores de lisibilité, les modèles n-gram et tf-idf, ainsi que leur implémentation avec scikit-learn et spaCy. Vous apprendrez aussi à mesurer la similarité entre deux documents. Au fil des exercices, vous prédirez le sentiment de critiques de films et construirez des systèmes de recommandation pour des films et des TED Talks. À l’issue du cours, vous saurez concevoir des features essentielles à partir de n’importe quel texte et résoudre certaines des tâches les plus exigeantes de la data science !

Prérequis

Introduction to Natural Language Processing in PythonSupervised Learning with scikit-learn
1

Features de base et scores de lisibilité

Apprenez à calculer des features de base comme le nombre de mots, le nombre de caractères, la longueur moyenne des mots et le nombre de caractères spéciaux (comme les hashtags et mentions Twitter). Vous apprendrez également à calculer des scores de lisibilité et à déterminer le niveau d’études nécessaire pour comprendre un texte.
Commencer le chapitre
2

Prétraitement du texte, POS tagging et NER

Dans ce chapitre, vous découvrirez la tokenisation et la lemmatisation. Vous verrez ensuite comment effectuer le nettoyage de texte, l’étiquetage grammatical (part-of-speech) et la reconnaissance d’entités nommées avec la bibliothèque spaCy. Une fois ces notions maîtrisées, vous rendrez le discours de Gettysburg exploitable par machine, analyserez l’usage des noms dans de fausses informations et identifierez les personnes mentionnées dans un article de TechCrunch.
Commencer le chapitre
Feature Engineering pour le NLP en Python
Cours
terminé

Obtenez un certificat de réussite

Ajoutez cette certification à votre profil LinkedIn, à votre CV ou à votre portfolio
Partagez-la sur les réseaux sociaux et dans votre évaluation de performance
S'inscrire maintenant

Rejoignez plus de 19 millions d'utilisateurs et commencez Feature Engineering pour le NLP en Python dès aujourd'hui !

Créez votre compte gratuitement

Continuer avec GoogleAfficher plus d’options

ou


En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.

Apprenez où que vous soyez avec l'application DataCamp

Progressez où que vous soyez grâce à nos cours conçus pour mobile et à nos défis quotidiens de 5 minutes.