Saltar al contenido principal

Inicio PythonIntroducción al Procesamiento del lenguaje natural en Python

Introducción al Procesamiento del lenguaje natural en Python

Comience El Curso Gratis

4 Horas15 Videos51 Ejercicios

115.198 AprendicesDeclaración de cumplimiento

Crea Tu Cuenta Gratuita

Google LinkedIn Facebook

o

Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.

¿Entrenar a 2 o más personas?Pruebe DataCamp para empresas

Preferido por estudiantes en miles de empresas

Descripción del curso

En este curso, aprenderás los fundamentos del Procesamiento del lenguaje natural (PLN), como identificar y separar palabras, extraer temas de un texto y construir tu propio clasificador de noticias falsas. También aprenderás a utilizar bibliotecas básicas como NLTK, junto con bibliotecas que utilizan el aprendizaje profundo para resolver problemas habituales de PNL. Este curso te dará las bases para procesar y analizar texto a medida que avances en tu aprendizaje de Python.

Empresas

¿Entrenar a 2 o más personas?

Obtenga acceso de su equipo a la biblioteca completa de DataCamp, con informes centralizados, tareas, proyectos y más

En las siguientes pistas

Científico de Machine Learning con Python

Procesamiento del Lenguaje Natural en Python

1
Expresiones regulares y tokenización de palabras
Gratuito
Este capítulo introducirá algunos conceptos básicos de la PNL, como la tokenización de palabras y las expresiones regulares para ayudar a analizar el texto. También aprenderás a manejar texto no inglés y la tokenización más difícil que puedas encontrar.
Reproducir Capítulo Ahora
Introducción a las expresiones regulares
50 xp
¿Qué patrón?
50 xp
Práctica de expresiones regulares: re.split() y re.findall()
100 xp
Introducción a la tokenización
50 xp
Tokenización de palabras con NLTK
100 xp
Más regex con re.search()
100 xp
Tokenización avanzada con NLTK y regex
50 xp
Selección de un tokenizador
50 xp
Regex con tokenización NLTK
100 xp
Tokenización no ASCII
100 xp
Representación de la longitud de las palabras con NLTK
50 xp
Práctica de representación
100 xp
2
Identificación sencilla de temas
Este capítulo te introducirá en la identificación de temas, que podrás aplicar a cualquier texto que encuentres en la naturaleza. Utilizando modelos básicos de PNL, identificarás los temas de los textos basándote en las frecuencias de los términos. Experimentarás y compararás dos métodos sencillos: bolsa de palabras y Tf-idf utilizando NLTK, y una nueva biblioteca Gensim.
Reproducir Capítulo Ahora
Recuentos de palabras con bolsa de palabras
50 xp
Selector de bolsa de palabras
50 xp
Creación de un contador con bolsa de palabras
100 xp
Preprocesamiento de texto simple
50 xp
Pasos del preprocesamiento de texto
50 xp
Práctica de preprocesamiento de texto
100 xp
Introducción a Gensim
50 xp
¿Qué son los vectores de palabras?
50 xp
Creación y consulta de un corpus con Gensim
100 xp
Bolsa de palabras Gensim
100 xp
Tf-idf con Gensim
50 xp
¿Qué es tf-idf?
50 xp
Tf-idf con Wikipedia
100 xp
3
Reconocimiento de entidades con nombre
Este capítulo introducirá un tema algo más avanzado: el reconocimiento de entidades con nombre. Aprenderás a identificar el quién, el qué y el dónde de tus textos utilizando modelos preentrenados en textos ingleses y no ingleses. También aprenderás a utilizar algunas bibliotecas nuevas, polyglot y spaCy, para añadirlas a tu caja de herramientas de PNL.
Reproducir Capítulo Ahora
Reconocimiento de entidades nombradas
50 xp
NER con NLTK
100 xp
Práctica de representación
100 xp
Biblioteca de Stanford con NLTK
50 xp
Introducción a SpaCy
50 xp
Comparación de NLTK con NER de spaCy
100 xp
Categorías de NER de spaCy
50 xp
NER multilingüe con polyglot
50 xp
NER de francés con polyglot I
100 xp
NER de francés con polyglot II
100 xp
NER de español con polyglot
100 xp
4
Construir un clasificador de "noticias falsas"
Aplicarás lo básico de lo que has aprendido junto con algo de machine learning supervisado para construir un detector de "noticias falsas". Empezarás aprendiendo los fundamentos del machine learning supervisado, y luego avanzarás eligiendo algunas características importantes y probando ideas para identificar y clasificar artículos de noticias falsas.
Reproducir Capítulo Ahora
Clasificación de noticias falsas mediante aprendizaje supervisado con NLP
50 xp
¿Qué posibles características?
50 xp
Entrenamiento y pruebas
50 xp
Creación de vectores de recuento de palabras con scikit-learn
50 xp
CountVectorizer para la clasificación de textos
100 xp
TfidfVectorizador para la clasificación de textos
100 xp
Inspección de los vectores
100 xp
Entrenamiento y pruebas de un modelo de clasificación con scikit-learn
50 xp
Modelos de clasificación de textos
50 xp
Entrenamiento y pruebas del modelo de "noticias falsas" con CountVectorizer
100 xp
Entrenamiento y pruebas del modelo de "noticias falsas" con TfidfVectorizer
100 xp
NLP sencillo, problemas complejos
50 xp
Mejora del modelo
50 xp
Mejora de tu modelo
100 xp
Inspección de tu modelo
100 xp

Empresas

¿Entrenar a 2 o más personas?

Obtenga acceso de su equipo a la biblioteca completa de DataCamp, con informes centralizados, tareas, proyectos y más

En las siguientes pistas

Científico de Machine Learning con Python

Procesamiento del Lenguaje Natural en Python

Sets De Datos

English stopwords Monty Python and the Holy Grail News articles Wikipedia articles

Colaboradores

Hugo Bowne-Anderson

Yashas Roy

Requisitos Previos

Python Data Science Toolbox (Part 2)

Katharine Jarmul

Founder, kjamistan

¿Qué tienen que decir otros alumnos?

¡Únete a 13 millones de estudiantes y empieza Introducción al Procesamiento del lenguaje natural en Python hoy mismo!

Crea Tu Cuenta Gratuita

Google LinkedIn Facebook

o

Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.