Pular para o conteúdo principal
InícioPython

Curso

Feature Engineering para NLP em Python

AvançadoNível de habilidade
Atualizado 11/2024
Aprenda técnicas para extrair informações de textos e processá-las em um formato adequado para aprendizado de máquina.
Iniciar Curso Gratuitamente
PythonMachine Learning4 h15 vídeos52 Exercícios4,200 XP28,924Certificado de conclusão

Crie sua conta gratuita

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.

Preferido por alunos de milhares de empresas

Group

Treinar 2 ou mais pessoas?

Experimentar DataCamp for Business

Descrição do curso

Neste curso, você vai aprender técnicas para extrair informações úteis de textos e processá-las em um formato adequado para aplicar modelos de Machine Learning. Mais especificamente, você vai aprender sobre marcação de classes gramaticais (POS tagging), reconhecimento de entidades nomeadas, índices de legibilidade, os modelos de n-gramas e tf-idf, e como implementá-los usando scikit-learn e spaCy. Você também vai aprender a calcular o quão similares dois documentos são entre si. No processo, você vai prever o sentimento de críticas de filmes e construir recomendadores de filmes e de TED Talks. Ao final, você será capaz de criar features essenciais a partir de qualquer texto e resolver alguns dos problemas mais desafiadores em ciência de dados!

Pré-requisitos

Introduction to Natural Language Processing in PythonSupervised Learning with scikit-learn
1

Basic features and readability scores

Learn to compute basic features such as number of words, number of characters, average word length and number of special characters (such as Twitter hashtags and mentions). You will also learn to compute readability scores and determine the amount of education required to comprehend a piece of text.
Iniciar Capítulo
2

Text preprocessing, POS tagging and NER

In this chapter, you will learn about tokenization and lemmatization. You will then learn how to perform text cleaning, part-of-speech tagging, and named entity recognition using the spaCy library. Upon mastering these concepts, you will proceed to make the Gettysburg address machine-friendly, analyze noun usage in fake news, and identify people mentioned in a TechCrunch article.
Iniciar Capítulo
3

N-Gram models

4

TF-IDF and similarity scores

Feature Engineering para NLP em Python
Curso
concluído

Obtenha um certificado de conclusão

Adicione esta credencial ao seu perfil do LinkedIn, currículo ou CV
Compartilhe nas redes sociais e em sua avaliação de desempenho
Inscreva-se Agora

Faça como mais de 19 milhões de alunos e comece Feature Engineering para NLP em Python hoje mesmo!

Crie sua conta gratuita

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.

Desenvolva suas habilidades em dados com o app do DataCamp

Continue progredindo em qualquer lugar com nossos cursos para celular e desafios diários de programação de 5 minutos.