Ir al contenido principal
InicioPython

Curso

Ingeniería de características para NLP en Python

AvanzadoNivel de habilidad
Actualizado 11/2024
Aprende técnicas para extraer información útil del texto y procesarla en un formato adecuado para machine learning.
Comienza El Curso Gratis
PythonMachine Learning4 h15 vídeos52 Ejercicios4,200 XP28,924Certificado de logros

Crea Tu Cuenta Gratuita

o

Al continuar, aceptas nuestros Términos de uso, nuestra Política de privacidad y que tus datos se almacenen en los EE. UU.

Preferido por estudiantes en miles de empresas

Group

¿Formar a 2 o más personas?

Probar DataCamp for Business

Descripción del curso

En este curso, aprenderás técnicas para extraer información útil de texto y procesarla en un formato apto para aplicar modelos de ML. En concreto, verás el etiquetado POS, el reconocimiento de entidades con nombre, las métricas de legibilidad, los modelos de n-gramas y tf-idf, y cómo implementarlos con scikit-learn y spaCy. También aprenderás a calcular cuán similares son dos documentos entre sí. Durante el curso, predecirás el sentimiento de reseñas de películas y crearás sistemas de recomendación de películas y charlas TED. Al finalizar, serás capaz de diseñar características clave a partir de cualquier texto y afrontar algunos de los problemas más desafiantes de la ciencia de datos.

Requisitos previos

Introduction to Natural Language Processing in PythonSupervised Learning with scikit-learn
1

Basic features and readability scores

Learn to compute basic features such as number of words, number of characters, average word length and number of special characters (such as Twitter hashtags and mentions). You will also learn to compute readability scores and determine the amount of education required to comprehend a piece of text.
Iniciar Capítulo
2

Text preprocessing, POS tagging and NER

In this chapter, you will learn about tokenization and lemmatization. You will then learn how to perform text cleaning, part-of-speech tagging, and named entity recognition using the spaCy library. Upon mastering these concepts, you will proceed to make the Gettysburg address machine-friendly, analyze noun usage in fake news, and identify people mentioned in a TechCrunch article.
Iniciar Capítulo
3

N-Gram models

4

TF-IDF and similarity scores

Ingeniería de características para NLP en Python
Curso
completo

Obtener certificado de logros

Añade esta certificación a tu perfil de LinkedIn o a tu currículum.
Compártelo en redes sociales y en tu evaluación de desempeño.
Inscríbete Ahora

¡Únete a 19 millones de estudiantes y empieza Ingeniería de características para NLP en Python hoy mismo!

Crea Tu Cuenta Gratuita

o

Al continuar, aceptas nuestros Términos de uso, nuestra Política de privacidad y que tus datos se almacenen en los EE. UU.

Desarrolla tus habilidades de datos con la aplicación móvil de DataCamp

Progresa desde cualquier dispositivo móvil con nuestros cursos y desafíos de programación diarios de 5 minutos.