Introdução ao processamento de linguagem natural em Python
Aprenda técnicas fundamentais de processamento de linguagem natural com Python e aplique-as em dados reais.
Comece O Curso Gratuitamente4 horas15 vídeos51 exercícios
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.Treinar 2 ou mais pessoas?Experimente o DataCamp For Business
Amado por alunos de milhares de empresas
Descrição do Curso
Neste curso, você aprenderá noções básicas de processamento de linguagem natural (NLP), como identificar e separar palavras, extrair tópicos em um texto e criar seu próprio classificador de notícias falsas. Você também aprenderá a usar bibliotecas básicas, como NLTK, juntamente com bibliotecas que utilizam a aprendizagem profunda para resolver problemas comuns do NLP. Este curso dará a você a base para processar e analisar textos à medida que avança em seu aprendizado de Python.
Para Empresas
Treinar 2 ou mais pessoas?
Obtenha acesso à biblioteca completa do DataCamp, com relatórios, atribuições, projetos e muito mais centralizadosNas seguintes faixas
Cientista de aprendizado de máquina com Python
Ir para a trilhaProcessamento de linguagem natural em Python
Ir para a trilha- 1
Expressões regulares e tokenização de palavras
GratuitoEste capítulo apresentará alguns conceitos básicos do NLP, como tokenização de palavras e expressões regulares para ajudar a analisar o texto. Você também aprenderá a lidar com textos que não estejam em inglês e com a tokenização mais difícil que possa encontrar.
Introdução às expressões regulares50 xpQual padrão?50 xpPraticando expressões regulares: re.split() e re.findall()100 xpIntrodução à tokenização50 xpTokenização de palavras com NLTK100 xpMais regex com re.search()100 xpTokenização avançada com NLTK e regex50 xpEscolha de um tokenizador50 xpRegex com tokenização NLTK100 xpTokenização não-ascii100 xpGráfico de comprimento de palavras com NLTK50 xpPrática de gráficos100 xp - 2
Identificação simples de tópicos
Este capítulo apresentará a identificação de tópicos, que você pode aplicar a qualquer texto que encontrar na natureza. Usando modelos básicos do NLP, você identificará tópicos de textos com base em frequências de termos. Você fará experimentos e comparará dois métodos simples: bag-of-words e Tf-idf usando NLTK e uma nova biblioteca Gensim.
Contagens de palavras com saco de palavras50 xpSelecionador de saco de palavras50 xpCriando um contador com um conjunto de palavras100 xpPré-processamento de texto simples50 xpEtapas de pré-processamento de texto50 xpPrática de pré-processamento de texto100 xpIntrodução ao gensim50 xpO que são vetores de palavras?50 xpCriando e consultando um corpus com o gensim100 xpSaco de palavras Gensim100 xpTf-idf com gensim50 xpO que é tf-idf?50 xpTf-idf com a Wikipédia100 xp - 3
Reconhecimento de entidades nomeadas
Este capítulo apresentará um tópico um pouco mais avançado: reconhecimento de entidades nomeadas. Você aprenderá a identificar quem, o quê e onde dos seus textos usando modelos pré-treinados em textos em inglês e em outros idiomas. Você também aprenderá a usar algumas novas bibliotecas, polyglot e spaCy, para adicionar à sua caixa de ferramentas NLP.
Reconhecimento de entidades nomeadas50 xpNER com NLTK100 xpPrática de gráficos100 xpBiblioteca de Stanford com NLTK50 xpIntrodução ao SpaCy50 xpComparando NLTK com spaCy NER100 xpspaCy NER Categorias50 xpMultilíngue NER com poliglota50 xpFrancês NER com poliglota I100 xpFrancês NER com poliglota II100 xpEspanhol NER com poliglota100 xp - 4
Criação de um classificador de "notícias falsas"
Você aplicará os conceitos básicos do que aprendeu, juntamente com um pouco de aprendizado de máquina supervisionado, para criar um detector de "notícias falsas". Você começará aprendendo os fundamentos do aprendizado de máquina supervisionado e, em seguida, avançará escolhendo alguns recursos importantes e testando ideias para identificar e classificar artigos de notícias falsas.
Classificação de notícias falsas usando aprendizado supervisionado com NLP50 xpQuais são os recursos possíveis?50 xpTreinamento e testes50 xpCriando vetores de contagem de palavras com o scikit-learn50 xpCountVectorizer para classificação de texto100 xpTfidfVectorizer para classificação de texto100 xpInspecionar os vetores100 xpTreinamento e teste de um modelo de classificação com o scikit-learn50 xpModelos de classificação de texto50 xpTreinamento e teste do modelo de "notícias falsas" com o CountVectorizer100 xpTreinamento e teste do modelo de "notícias falsas" com o TfidfVectorizer100 xpSimples NLP, problemas complexos50 xpAprimorando o modelo50 xpAprimorando seu modelo100 xpInspecionando seu modelo100 xp
Para Empresas
Treinar 2 ou mais pessoas?
Obtenha acesso à biblioteca completa do DataCamp, com relatórios, atribuições, projetos e muito mais centralizadosNas seguintes faixas
Cientista de aprendizado de máquina com Python
Ir para a trilhaProcessamento de linguagem natural em Python
Ir para a trilhacolaboradores
pré-requisitos
Python ToolboxKatharine Jarmul
Ver MaisFounder, kjamistan
O que os outros alunos têm a dizer?
Junte-se a mais de 14 milhões de alunos e comece Introdução ao processamento de linguagem natural em Python hoje mesmo!
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.