Pular para o conteúdo principal
InícioPython

Curso

Feature Engineering para NLP em Python

AvançadoNível de habilidade
Atualizado 11/2024
Aprenda técnicas para extrair informações de textos e processá-las em um formato adequado para aprendizado de máquina.
Iniciar curso gratuitamente
PythonMachine Learning
4 h
15 vídeos
52 Exercícios
4,200 XP
29,246
Declaração de realização

Crie sua conta gratuita

Continuar com o GoogleMostrar mais opções

ou


Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.

Preferido por alunos de milhares de empresas

Group

Treinando uma equipe?

Experimente para Empresas

Descrição do curso

Neste curso, você vai aprender técnicas para extrair informações úteis de textos e processá-las em um formato adequado para aplicar modelos de Machine Learning. Mais especificamente, você vai aprender sobre marcação de classes gramaticais (POS tagging), reconhecimento de entidades nomeadas, índices de legibilidade, os modelos de n-gramas e tf-idf, e como implementá-los usando scikit-learn e spaCy. Você também vai aprender a calcular o quão similares dois documentos são entre si. No processo, você vai prever o sentimento de críticas de filmes e construir recomendadores de filmes e de TED Talks. Ao final, você será capaz de criar features essenciais a partir de qualquer texto e resolver alguns dos problemas mais desafiadores em ciência de dados!

Pré-requisitos

Introduction to Natural Language Processing in PythonSupervised Learning with scikit-learn
1

Features básicas e índices de legibilidade

Aprenda a calcular features básicas como número de palavras, número de caracteres, comprimento médio das palavras e quantidade de caracteres especiais (como hashtags e menções do Twitter). Você também vai aprender a calcular índices de legibilidade e a determinar o nível de escolaridade necessário para compreender um texto.
Iniciar capítulo
2

Pré-processamento de texto, POS tagging e NER

Neste capítulo, você vai aprender sobre tokenização e lematização. Em seguida, verá como realizar limpeza de texto, marcação de classes gramaticais (part-of-speech) e reconhecimento de entidades nomeadas usando a biblioteca spaCy. Depois de dominar esses conceitos, você vai tornar o discurso de Gettysburg legível por máquina, analisar o uso de substantivos em notícias falsas e identificar pessoas mencionadas em um artigo do TechCrunch.
Iniciar capítulo
Feature Engineering para NLP em Python
Curso
concluído

Obtenha um certificado de conclusão

Adicione esta credencial ao seu perfil do LinkedIn, currículo ou CV
Compartilhe nas redes sociais e em sua avaliação de desempenho
Inscreva-se agora

Faça como mais de 19 milhões de alunos e comece Feature Engineering para NLP em Python hoje mesmo!

Crie sua conta gratuita

Continuar com o GoogleMostrar mais opções

ou


Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.

Desenvolva suas habilidades em dados com o app do DataCamp

Continue progredindo em qualquer lugar com nossos cursos para celular e desafios diários de programação de 5 minutos.