Vai al contenuto principale
HomePython

Corso

Feature Engineering per NLP in Python

AvanzatoLivello di competenza
Aggiornato 11/2024
Impara i trucchi per prendere le informazioni utili da un testo e trasformarle in un formato che va bene per l'apprendimento automatico.
Inizia il corso gratis
PythonMachine Learning
4 h
15 video
52 Esercizi
4,200 XP
29,264
Attestato di conseguimento

Crea il tuo account gratuito

Continua con GoogleMostra più opzioni

o


Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.

Preferito dagli studenti di migliaia di aziende

Group

Formare un team?

Prova per il Business

Descrizione del corso

In questo corso imparerai tecniche per estrarre informazioni utili dal testo e trasformarle in un formato adatto all'applicazione di modelli di ML. In particolare, scoprirai il POS tagging, il riconoscimento di entità nominate (NER), gli indici di leggibilità, i modelli n-gram e tf-idf, e come implementarli con scikit-learn e spaCy. Imparerai anche a calcolare quanto sono simili tra loro due documenti. Lavorando su questi concetti, prevederai il sentiment delle recensioni di film e costruirai sistemi di raccomandazione per film e TED Talk. Alla fine del corso, sarai in grado di progettare feature fondamentali a partire da qualsiasi testo e affrontare alcuni dei problemi più impegnativi della data science!

Prerequisiti

Introduction to Natural Language Processing in PythonSupervised Learning with scikit-learn
1

Feature di base e indici di leggibilità

Impara a calcolare feature di base come numero di parole, numero di caratteri, lunghezza media delle parole e numero di caratteri speciali (come hashtag e menzioni su Twitter). Imparerai anche a calcolare gli indici di leggibilità e a determinare il livello di istruzione necessario per comprendere un testo.
Inizia il capitolo
2

Preprocessing del testo, POS tagging e NER

In questo capitolo imparerai tokenizzazione e lemmatizzazione. Poi vedrai come effettuare pulizia del testo, part-of-speech tagging e riconoscimento di entità nominate usando la libreria spaCy. Una volta padroneggiati questi concetti, renderai il discorso di Gettysburg adatto alle macchine, analizzerai l’uso dei sostantivi nelle fake news e identificherai le persone citate in un articolo di TechCrunch.
Inizia il capitolo
Feature Engineering per NLP in Python
Corso
completato

Ottieni Attestato di conseguimento

Aggiungi questa certificazione al tuo profilo LinkedIn, al curriculum o al CV
Condividila sui social e nella valutazione delle tue performance
Iscriviti ora

Unisciti a oltre 19 milioni di studenti e inizia Feature Engineering per NLP in Python oggi!

Crea il tuo account gratuito

Continua con GoogleMostra più opzioni

o


Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.

Aumenta le tue competenze sui dati con l'app di DataCamp

Avanza ovunque ti trovi con i nostri corsi per dispositivi mobili e le nostre sfide di programmazione quotidiane da 5 minuti.