Ir al contenido principal
InicioPython

Curso

Ingeniería de características para NLP en Python

AvanzadoNivel de habilidad
Actualizado 11/2024
Aprende técnicas para extraer información útil del texto y procesarla en un formato adecuado para machine learning.
Comienza el curso gratis
PythonMachine Learning
4 h
15 vídeos
52 Ejercicios
4,200 XP
29,246
Certificado de logros

Crea tu cuenta gratuita

Continuar con GoogleMostrar más opciones

o


Al continuar, aceptas nuestros Términos de uso, nuestra Política de privacidad y que tus datos se almacenen en los EE. UU.

Preferido por estudiantes en miles de empresas

Group

¿Formando un equipo?

Prueba para empresas

Descripción del curso

En este curso, aprenderás técnicas para extraer información útil de texto y procesarla en un formato apto para aplicar modelos de ML. En concreto, verás el etiquetado POS, el reconocimiento de entidades con nombre, las métricas de legibilidad, los modelos de n-gramas y tf-idf, y cómo implementarlos con scikit-learn y spaCy. También aprenderás a calcular cuán similares son dos documentos entre sí. Durante el curso, predecirás el sentimiento de reseñas de películas y crearás sistemas de recomendación de películas y charlas TED. Al finalizar, serás capaz de diseñar características clave a partir de cualquier texto y afrontar algunos de los problemas más desafiantes de la ciencia de datos.

Requisitos previos

Introduction to Natural Language Processing in PythonSupervised Learning with scikit-learn
1

Características básicas y métricas de legibilidad

Aprende a calcular características básicas como el número de palabras, el número de caracteres, la longitud media de las palabras y el número de caracteres especiales (como hashtags y menciones de Twitter). También aprenderás a calcular métricas de legibilidad y a determinar el nivel educativo necesario para comprender un texto.
Iniciar capítulo
2

Preprocesamiento de texto, etiquetado POS y NER

En este capítulo, aprenderás sobre tokenización y lematización. Después verás cómo realizar limpieza de texto, etiquetado de categorías gramaticales (part-of-speech) y reconocimiento de entidades con nombre usando la biblioteca spaCy. Una vez domines estos conceptos, convertirás el discurso de Gettysburg en apto para máquinas, analizarás el uso de sustantivos en noticias falsas e identificarás las personas mencionadas en un artículo de TechCrunch.
Iniciar capítulo
Ingeniería de características para NLP en Python
Curso
completo

Obtener certificado de logros

Añade esta certificación a tu perfil de LinkedIn o a tu currículum.
Compártelo en redes sociales y en tu evaluación de desempeño.
Inscríbete ahora

¡Únete a 19 millones de estudiantes y empieza Ingeniería de características para NLP en Python hoy mismo!

Crea tu cuenta gratuita

Continuar con GoogleMostrar más opciones

o


Al continuar, aceptas nuestros Términos de uso, nuestra Política de privacidad y que tus datos se almacenen en los EE. UU.

Desarrolla tus habilidades de datos con la aplicación móvil de DataCamp

Progresa desde cualquier dispositivo móvil con nuestros cursos y desafíos de programación diarios de 5 minutos.