Introducción al Procesamiento del lenguaje natural en Python
Comience El Curso Gratis4 Horas15 Videos51 Ejercicios
Crea Tu Cuenta Gratuita
o
Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.¿Entrenar a 2 o más personas?Pruebe DataCamp para empresas
Preferido por estudiantes en miles de empresas
Descripción del curso
En este curso, aprenderás los fundamentos del Procesamiento del lenguaje natural (PLN), como identificar y separar palabras, extraer temas de un texto y construir tu propio clasificador de noticias falsas. También aprenderás a utilizar bibliotecas básicas como NLTK, junto con bibliotecas que utilizan el aprendizaje profundo para resolver problemas habituales de PNL. Este curso te dará las bases para procesar y analizar texto a medida que avances en tu aprendizaje de Python.
Empresas
¿Entrenar a 2 o más personas?
Obtenga acceso de su equipo a la biblioteca completa de DataCamp, con informes centralizados, tareas, proyectos y másEn las siguientes pistas
Científico de Machine Learning con Python
Ir a la pistaProcesamiento del Lenguaje Natural en Python
Ir a la pista- 1
Expresiones regulares y tokenización de palabras
GratuitoEste capítulo introducirá algunos conceptos básicos de la PNL, como la tokenización de palabras y las expresiones regulares para ayudar a analizar el texto. También aprenderás a manejar texto no inglés y la tokenización más difícil que puedas encontrar.
Introducción a las expresiones regulares50 xp¿Qué patrón?50 xpPráctica de expresiones regulares: re.split() y re.findall()100 xpIntroducción a la tokenización50 xpTokenización de palabras con NLTK100 xpMás regex con re.search()100 xpTokenización avanzada con NLTK y regex50 xpSelección de un tokenizador50 xpRegex con tokenización NLTK100 xpTokenización no ASCII100 xpRepresentación de la longitud de las palabras con NLTK50 xpPráctica de representación100 xp - 2
Identificación sencilla de temas
Este capítulo te introducirá en la identificación de temas, que podrás aplicar a cualquier texto que encuentres en la naturaleza. Utilizando modelos básicos de PNL, identificarás los temas de los textos basándote en las frecuencias de los términos. Experimentarás y compararás dos métodos sencillos: bolsa de palabras y Tf-idf utilizando NLTK, y una nueva biblioteca Gensim.
Recuentos de palabras con bolsa de palabras50 xpSelector de bolsa de palabras50 xpCreación de un contador con bolsa de palabras100 xpPreprocesamiento de texto simple50 xpPasos del preprocesamiento de texto50 xpPráctica de preprocesamiento de texto100 xpIntroducción a Gensim50 xp¿Qué son los vectores de palabras?50 xpCreación y consulta de un corpus con Gensim100 xpBolsa de palabras Gensim100 xpTf-idf con Gensim50 xp¿Qué es tf-idf?50 xpTf-idf con Wikipedia100 xp - 3
Reconocimiento de entidades con nombre
Este capítulo introducirá un tema algo más avanzado: el reconocimiento de entidades con nombre. Aprenderás a identificar el quién, el qué y el dónde de tus textos utilizando modelos preentrenados en textos ingleses y no ingleses. También aprenderás a utilizar algunas bibliotecas nuevas, polyglot y spaCy, para añadirlas a tu caja de herramientas de PNL.
Reconocimiento de entidades nombradas50 xpNER con NLTK100 xpPráctica de representación100 xpBiblioteca de Stanford con NLTK50 xpIntroducción a SpaCy50 xpComparación de NLTK con NER de spaCy100 xpCategorías de NER de spaCy50 xpNER multilingüe con polyglot50 xpNER de francés con polyglot I100 xpNER de francés con polyglot II100 xpNER de español con polyglot100 xp - 4
Construir un clasificador de "noticias falsas"
Aplicarás lo básico de lo que has aprendido junto con algo de machine learning supervisado para construir un detector de "noticias falsas". Empezarás aprendiendo los fundamentos del machine learning supervisado, y luego avanzarás eligiendo algunas características importantes y probando ideas para identificar y clasificar artículos de noticias falsas.
Clasificación de noticias falsas mediante aprendizaje supervisado con NLP50 xp¿Qué posibles características?50 xpEntrenamiento y pruebas50 xpCreación de vectores de recuento de palabras con scikit-learn50 xpCountVectorizer para la clasificación de textos100 xpTfidfVectorizador para la clasificación de textos100 xpInspección de los vectores100 xpEntrenamiento y pruebas de un modelo de clasificación con scikit-learn50 xpModelos de clasificación de textos50 xpEntrenamiento y pruebas del modelo de "noticias falsas" con CountVectorizer100 xpEntrenamiento y pruebas del modelo de "noticias falsas" con TfidfVectorizer100 xpNLP sencillo, problemas complejos50 xpMejora del modelo50 xpMejora de tu modelo100 xpInspección de tu modelo100 xp
Empresas
¿Entrenar a 2 o más personas?
Obtenga acceso de su equipo a la biblioteca completa de DataCamp, con informes centralizados, tareas, proyectos y másEn las siguientes pistas
Científico de Machine Learning con Python
Ir a la pistaProcesamiento del Lenguaje Natural en Python
Ir a la pistaColaboradores
Requisitos Previos
Python Data Science Toolbox (Part 2)Katharine Jarmul
Ver MasFounder, kjamistan
¿Qué tienen que decir otros alumnos?
¡Únete a 13 millones de estudiantes y empieza Introducción al Procesamiento del lenguaje natural en Python hoy mismo!
Crea Tu Cuenta Gratuita
o
Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.